Spring AI dalam Tindakan: Membina Aplikasi AI Sebenar dengan Spring Boot

Kemaskini terakhir: 02/13/2026
Pengarang C SourceTrail
  • Spring AI membawakan keupayaan AI mudah alih, berstruktur dan boleh diperhatikan kepada Spring Boot, mengabstrakkan penyedia LLM dan vektor utama di sebalik API Java yang konsisten.
  • Buku "Spring AI in Action" membimbing pembangun Spring daripada gesaan mudah kepada RAG, ejen, alatan, pertuturan dan kebolehcerapan lanjutan dengan corak praktikal dan berasaskan contoh.
  • Ciri berorientasikan perusahaan seperti Penasihat, memori perbualan, penilaian model dan penyepaduan Tanzu Gen AI membolehkan pembinaan sistem AI gred pengeluaran yang andal pada JVM.

Buku dan rangka kerja Spring AI in Action

Spring AI in Action dengan pantas menjadi rujukan utama bagi pembangun Java dan Spring Boot yang ingin membawa AI generatif moden ke dalam projek harian mereka tanpa meninggalkan susunan JVM. Daripada memaksa anda menggunakan ekosistem Python atau perkakasan yang sukar difahami, buku dan rangka kerja ini berfungsi seiring supaya anda boleh terus mengekod dalam Java atau Kotlin sambil tetap mengintegrasikan Model Bahasa Besar (LLM), Penjanaan Tambahan Perolehan (RAG), ejen, alatan dan ciri multimodal yang berkuasa.

Apa yang menjadikan ekosistem ini begitu menarik ialah gabungan rangka kerja sedia pengeluaran (Spring AI) dan panduan yang sangat pragmatik dan berasaskan contoh (Spring AI in Action oleh Craig Walls). Bersama-sama, mereka menunjukkan cara menghubungkan model AI, pangkalan data vektor, memori perbualan dan alat penilaian ke dalam aplikasi Spring Boot yang biasa menggunakan POJO mudah, konfigurasi automatik dan API mudah alih yang bersih yang menyembunyikan banyak kerumitan khusus penyedia.

Apakah Spring AI dan mengapa ia penting untuk pembangun Java

Spring AI ialah rangka kerja aplikasi yang direka untuk membawa prinsip Spring klasik—kebolehgunaan, seni bina modular dan reka bentuk berpusatkan POJO—ke dalam dunia kejuruteraan AI. Pada dasarnya, Spring AI memberi tumpuan kepada menyelesaikan masalah praktikal yang paling sukar dalam AI perusahaan: menghubungkan organisasi anda data and API dengan moden model AI dengan cara yang boleh dikekalkan, diperhatikan dan mudah berubah dari semasa ke semasa.

Daripada mengunci anda kepada satu vendor LLM, Spring AI mengabstrakkan kebanyakan penyedia besar. Di luar kotak, anda boleh bercakap dengan model daripada OpenAI, Azure OpenAI, Anthropic, Amazon Bedrock, Google, MistralAI dan juga model tempatan yang dilayan melalui Ollama. Model pengaturcaraan yang sama menyokong respons segerak dan penstriman, dan anda masih mengekalkan akses kepada keupayaan khusus penyedia apabila anda benar-benar memerlukannya.

Satu lagi tonggak utama Spring AI ialah sokongan kukuhnya untuk output berstruktur. Daripada menghuraikan teks mentah secara manual, anda boleh memetakan respons model terus kepada kelas dan rekod Java, menukarkan bahasa semula jadi yang tidak kemas kepada POJO yang bersih. Ini penting apabila anda membina ejen, alatan atau aliran kerja yang mesti menggunakan data yang boleh diramal dan bukannya teks tidak berstruktur.

Spring AI juga berintegrasi secara mendalam dengan pangkalan data vektor supaya anda boleh melaksanakan Penjanaan Semula Dipertingkatkan tanpa mencipta semula roda. Ia menyokong pembekal seperti Apache Cassandra, Azure Vector Search, Chroma, Milvus, MongoDB Atlas, Neo4j, Integrasi Oracle, PostgreSQL dengan PGVector, Pinecone, Qdrant, Redis dan Weaviate. API Vector Store mudah alih dan bahasa penapis metadata seperti SQL membolehkan anda menukar hujung belakang vektor dengan perubahan kod yang minimum.

Selain itu, Spring AI dilengkapi dengan perkakasan untuk kebolehcerapan, saluran pengingesan dokumen, penilaian model dan corak AI generatif. Anda mendapat kefasihan ChatClient sama dengan WebClient/RestClient, Penasihat untuk corak AI biasa seperti RAG dan memori perbualan, konfigurasi automatik dengan pemula Spring Boot dan utiliti untuk memantau penggunaan token dan mengesan halusinasi.

Di dalam “Spring AI in Action”: daripada Hello AI World kepada ejen penuh

“Spring AI in Action” oleh Craig Walls ialah panduan praktikal dan amali yang menunjukkan kepada anda cara menggunakan semua keupayaan Spring AI ini dalam aplikasi sebenar. Buku ini ditujukan khas kepada pembangun Spring dan menganggap anda sudah mengetahui Spring Boot, tetapi ia tidak memerlukan pengalaman AI generatif terdahulu; anda tidak perlu menjadi saintis data atau "pakar AI" untuk mengikutinya.

Perjalanan dalam buku ini bermula dengan contoh mudah “Hello AI World” dan secara beransur-ansur memperkenalkan teknik yang lebih maju apabila anda semakin selesa. Anda bermula dengan memasang panggilan LLM asas di dalam aplikasi Spring Boot, kemudian beralih kepada menjana ringkasan teks, pembantu binaan yang berada di dalam perkhidmatan web atau backend sedia ada anda dan membentuk gesaan supaya respons lebih membantu dan boleh diramal.

Semasa anda maju, kandungan akan merangkumi RAG, stor vektor dan senario multimodal di mana model berfungsi dengan teks dan imej. Anda belajar cara bertanya soalan tentang dokumen peribadi yang tidak pernah dilatih oleh model tersebut, cara menukar imej kepada teks dan sebaliknya, dan cara mendasarkan jawapan LLM dalam data anda sendiri supaya ia berhenti berhalusinasi apabila menghadapi soalan khusus domain.

Bahagian kedua buku ini meningkatkan piawaian dengan meneroka agen, penggunaan alat, pertuturan dan kebolehcerapan. Di sini anda dapat melihat cara membina ejen AI yang boleh menentukan bila hendak memanggil alatan atau API, cara menghalakan tugasan kepada gesaan khusus, cara menjejaki apa yang berlaku melalui metrik dan jejak serta cara memastikan sistem anda selamat dengan penilaian dan perlindungan sekitar kandungan yang dijana.

Sepanjang buku ini, Craig Walls mengekalkan ciri khasnya, gaya yang didorong oleh teladan, sentiasa memberi tumpuan kepada "menyelesaikan sesuatu" dan bukannya menenggelamkan anda dalam teori. Bab-bab penuh dengan petikan pragmatik dan senario realistik: chatbot yang benar-benar mengetahui data anda, pembantu yang tertanam dalam aliran kerja perniagaan dan ejen yang menguraikan tugas kompleks kepada bahagian yang lebih kecil dan boleh diurus.

Tajuk utama dan struktur buku

Isi kandungan “Spring AI in Action” memberikan gambaran yang jelas tentang keluasan apa yang akan anda bina. Daripada blok binaan asas kepada corak lanjutan, setiap bab memberi tumpuan kepada bidang khusus penyepaduan AI dengan Spring:

  • Bermula dengan Spring AI: membina semula projek, mengkonfigurasi penyedia, menghantar gesaan pertama anda.
  • Menilai respons yang dijana: mengukur kualiti, mengesan isu dan melindungi daripada kandungan berkualiti rendah atau halusinasi.
  • Menghantar gesaan untuk penjanaan: mereka bentuk gesaan, menggunakan templat dan mengawal tingkah laku model.
  • Bercakap dengan dokumen anda: melaksanakan RAG supaya LLM boleh menjawab soalan tentang data peribadi yang tidak terlatih.
  • Membolehkan ingatan perbualan: mengekalkan konteks sembang berbilang pusingan menggunakan penasihat memori Spring AI.
  • Mengaktifkan penjanaan berasaskan alat: membolehkan model memanggil fungsi dan alatan bahagian klien apabila mereka memerlukan data baharu atau luaran.
  • Mengaplikasikan Protokol Konteks Model (MCP): mengurus konteks yang lebih kaya dan interaksi dengan alatan dan sumber data.
  • Menjana dengan suara dan gambar: merangkumi keupayaan multimodal untuk pertuturan dan imej.
  • Memerhatikan operasi AI: menambah kebolehcerapan dan pemantauan ke dalam saluran paip AI anda.
  • Melindungi AI generatif: menggunakan pagar pengadang, penapis kandungan dan mekanisme perlindungan lain.
  • Menggunakan corak AI generatif: menangkap corak yang boleh diguna semula untuk aliran kerja AI.
  • Ejen yang menggaji: membina sistem agen yang boleh merancang, menghalakan dan memperhalusi kerja.

Ulasan daripada suara-suara yang dihormati dalam komuniti Spring dan Java mengetengahkan betapa mudah dan praktikalnya bahan tersebut. Penulis dan pengulas kata pengantar memuji buku ini kerana penjelasan yang jelas, demo yang meluas dan kedalaman "harta karun" tentang teknologi baru muncul, menggariskan bahawa ia kekal berasaskan pembangunan dunia sebenar dan bukannya abstraksi akademik.

Apabila anda membeli edisi cetak daripada Manning, anda juga akan mendapat eBook (PDF atau ePub) percuma serta akses kepada versi liveBook dalam talian mereka. Platform liveBook itu sendiri merangkumi pembantu AI yang mampu menjawab soalan anda dalam pelbagai bahasa, jadi anda boleh meneroka contoh, mencari teks dan menjelaskan topik semasa anda membaca.

Ciri teras Spring AI untuk aplikasi AI gred perusahaan

Di luar buku ini, rangka kerja Spring AI mendedahkan set ciri komprehensif yang disesuaikan untuk aplikasi AI gred pengeluaran. Ia bukan sekadar memanggil LLM; ia adalah tentang membina sistem lengkap yang selamat, boleh diperhatikan, boleh diuji dan mudah alih merentasi penyedia dan persekitaran.

Tahap fleksibiliti yang sama meliputi stor vektor. Dengan sokongan untuk Apache Cassandra, Azure Vector Search, Chroma, Milvus, MongoDB Atlas, Neo4j, Oracle, PostgreSQL/PGVector, Pinecone, Qdrant, Redis, Weaviate dan lain-lain, anda boleh melaksanakan RAG dan carian semantik tanpa perlu menghubungkan aplikasi anda kepada satu penyelesaian storan sahaja. API mudah alih dan penapis metadata ekspresif memudahkan untuk menjalankan pertanyaan persamaan yang kompleks.

Alat dan panggilan fungsi adalah warga kelas pertama dalam Spring AI. Model boleh meminta pelaksanaan alat dan fungsi bahagian klien untuk mendapatkan data masa nyata atau mencetuskan tindakan. Ini menukar LLM anda daripada penjana teks pasif kepada komponen aktif yang boleh membuat pertanyaan API, memanggil pangkalan data atau mengatur perkhidmatan melalui panggilan fungsi yang ditaip.

Kebolehcerapan dimasukkan ke dalam rangka kerja supaya anda dapat melihat apa yang dilakukan oleh AI anda di sebalik hud. Anda boleh mengumpul metrik tentang penggunaan token, latensi dan kadar ralat, mengesan panggilan melalui sistem anda dan mengaitkan aktiviti LLM dengan mikroservis anda yang lain. Ini penting apabila AI beralih daripada eksperimen kepada beban kerja kritikal perniagaan.

Spring AI juga merangkumi rangka kerja pengambilan dokumen gaya ETL untuk tugas kejuruteraan data. Ia membantu anda memuatkan, memotong dan mengindeks dokumen ke dalam stor vektor supaya saluran paip RAG anda kukuh dan boleh diulang, bukannya koleksi skrip ad-hoc.

ChatClient, Penasihat dan keupayaan perbualan

Pada peringkat pengekodan, kebanyakan interaksi Spring AI berkisar tentang ChatClient API, antara muka yang lancar diinspirasikan oleh corak Spring WebClient dan RestClient yang biasa. Anda membina dan menghantar gesaan, menerima respons, menstrim token sebaik sahaja ia tiba dan mengendalikan ralat dengan cara yang terasa semula jadi kepada pembangun Spring.

Penasihat merupakan satu lagi abstraksi utama yang merangkumi corak AI generatif biasa. Ia mengubah data yang masuk dan keluar dari LLM, melapisi tingkah laku seperti RAG atau memori dan menyediakan kebolehgunaan merentasi model dan kes penggunaan. Daripada memasang pendawaian manual setiap gesaan atau konteks, anda memasang Penasihat untuk mendapatkan tingkah laku yang mantap dengan plat standard yang minimum.

Ingatan perbualan dikendalikan melalui penasihat memori sembang khusus yang mengurus dialog berbilang pusingan. Memandangkan LLM sendiri tidak mempunyai kewarganegaraan dan "melupakan" giliran lalu, penasihat ini menjejaki sejarah perbualan dan memasukkan kembali hirisan konteks yang betul ke dalam setiap gesaan. Anda boleh memilih antara strategi yang berbeza dan juga melaksanakan ingatan jangka panjang yang berterusan dengan pendekatan berasaskan vektor.

Gabungan memori sembang dan RAG Advisors membolehkan anda membina pembantu yang boleh "bercakap" dengan dokumen anda melalui berbilang pusingan. Pengguna boleh bertanya susulan, memperhalusi soalan mereka dan merujuk bahagian awal perbualan, manakala Spring AI secara automatik mendapatkan dan menyuntik coretan dokumen yang paling relevan pada setiap permintaan.

Templat gesaan memudahkan untuk mengeksternalisasikan dan menggunakan semula gesaan. Anda menentukan templat generik yang menerima parameter, memasukkan arahan tambahan dan menentukan format output yang diingini (contohnya JSON yang dipetakan terus ke objek Java). Sebelum gesaan dihantar, Spring AI mengisi tempat kosong, menggunakan konteks dan memastikan arahan jelas kepada model.

RAG, pengurangan halusinasi dan pembantu yang peka terhadap dokumen

Penjanaan Semula Dipertingkat (RAG) merupakan salah satu corak terpenting yang diliputi oleh kedua-dua rangka kerja dan buku ini. Ia menyelesaikan batasan kritikal LLM statik: mereka hanya tahu apa yang mereka dilatih, yang bermaksud mereka tidak dapat melihat dokumentasi dalaman, data pelanggan atau pengetahuan proprietari anda secara lalai.

Dengan RAG, aplikasi anda mula-mula mengambil satu set kecil dokumen yang secara semantiknya serupa dengan soalan pengguna dan kemudian memasukkannya ke dalam model sebagai konteks. Spring AI mengabstrakkan banyak kerja ini, berintegrasi dengan berpuluh-puluh kedai vektor dan menyediakan API untuk membuat pertanyaan mengikut persamaan, menapis mengikut metadata dan melaraskan cara anda mengasingkan dan membenamkan kandungan anda.

RAG yang dilaksanakan dengan betul dapat mengurangkan halusinasi secara mendadak. Daripada meneka bila ia kekurangan maklumat atau terlalu terlatih tentang data internet generik, model ini diarahkan ke arah coretan khusus domain yang berkualiti tinggi. Buku ini menerangkan kes penggunaan "bersembang dengan dokumentasi anda" dan "Soal Jawab melalui dokumen anda" yang menunjukkan corak ini dari awal hingga akhir.

melalui QuestionAnswerAdvisor and ChatClient, anda boleh memacu keseluruhan aliran RAG secara eksplisit atau membiarkan Penasihat mengatur penyematan, pengambilan semula dan suntikan konteks untuk anda. Itu memberi anda fleksibiliti: mulakan dengan pendekatan mudah untuk bergerak pantas, kemudian turunkan tahap apabila anda memerlukan tingkah laku tersuai atau pengoptimuman mendalam.

Oleh kerana Spring AI menyokong respons penstriman, jawapan yang peka dokumen tersebut boleh distrim kembali ke UI semasa ia dijana. Ini meniru penaipan manusia dalam masa nyata dan memberikan pengalaman pengguna yang lebih baik, terutamanya apabila jawapannya panjang atau latensi model tinggi.

Corak agentik yang diilhamkan oleh penyelidikan Antropik

Spring AI juga melaksanakan satu set corak agentik yang diilhamkan oleh penyelidikan Anthropic tentang membina ejen LLM yang berkesan. Penekanan adalah pada kesederhanaan dan kebolehkompositan dan bukannya rangka kerja ejen yang berat dan legap, yang sejajar dengan keperluan perusahaan untuk sistem yang boleh diselenggara dan diuji.

Corak pertama, Aliran Kerja Rantai, memecahkan tugas besar kepada beberapa langkah yang lebih kecil dan teratur. Setiap langkah menggunakan gesaannya sendiri, menggunakan output langkah sebelumnya dan menghasilkan hasil perantaraan yang diperhalusi. Dalam Spring AI, ini kelihatan seperti mengulangi gesaan sistem dan menggunakan ChatClient berulang kali, menyampaikan respons sebelumnya sebagai sebahagian daripada input seterusnya, mewujudkan saluran paip yang jelas dan boleh dilanjutkan.

Aliran Kerja Selari adalah tentang menjalankan berbilang panggilan LLM pada masa yang sama dan mengagregatkan outputnya. Anda boleh menggunakannya untuk "pembahagian" (membahagikan kerja kepada bahagian-bahagian berasingan) atau "pengundian" (mempunyai beberapa larian model yang menangani gesaan yang sama dan kemudian menggabungkan keputusan). Contohnya, anda mungkin meminta model tersebut menganalisis kesan perubahan pasaran terhadap pelanggan, pekerja, pelabur dan pembekal secara selari, kemudian menggabungkan pandangan tersebut.

Aliran Kerja Penghalaan memperkenalkan penghantaran pintar ke dalam campuran tersebut. LLM terlebih dahulu mengklasifikasikan input dan memutuskan gesaan atau pengendali khusus yang harus memprosesnya: soalan pengebilan dihantar ke satu gesaan pakar, isu teknikal ke yang lain, pertanyaan generik ke pembantu umum. Aliran kerja penghalaan Spring AI menghubungkan logik ini bersama-sama melalui ChatClient dan peta laluan.

Orchestrator‑Workers ialah corak yang lebih maju yang masih mengelakkan autonomi yang tidak terkawal. Model "orkestrator" pusat menguraikan tugas yang kompleks kepada subtugas, kemudian pekerja khusus menangani subtugas tersebut, selalunya secara selari. Setelah pekerja selesai, output mereka digabungkan menjadi hasil akhir. Spring AI menyediakan blok binaan untuk melaksanakan corak ini sambil memastikan tanggungjawab jelas dan boleh diramal.

Akhir sekali, corak Evaluator-Optimizer menggunakan dua model yang bekerjasama. Satu model bertindak sebagai penjana yang mencadangkan penyelesaian, manakala model kedua bertindak seperti pengkritik atau pengulas, menyemak penyelesaian terhadap kriteria yang jelas dan memberi maklum balas penambahbaikan. Gelung ini berterusan sehingga penilai berpuas hati, menghasilkan respons yang diperhalusi bersama-sama dengan jejak evolusi penyelesaian.

Amalan terbaik, kebolehpercayaan dan evolusi masa hadapan

Corak dan ciri dalam Spring AI disertakan dengan amalan terbaik yang jelas yang muncul daripada penyelidikan Anthropic dan pengalaman pengeluaran ekosistem Spring. Nasihat biasa adalah bermula dengan aliran kerja paling mudah yang mungkin berfungsi, kemudian lapisan kerumitan hanya apabila ia jelas menambah nilai.

Kebolehpercayaan harus menjadi keutamaan kelas pertama dalam mana-mana sistem yang didayakan LLM. Ini bermakna menggunakan output berstruktur jenis-selamat di mana sahaja yang mungkin, mengesahkan respons, menambah pengendalian ralat yang kukuh dan percubaan semula, dan menginstrumentasikan saluran paip anda dengan metrik dan log. Apabila sesuatu berlaku, anda sepatutnya dapat memahami sebabnya dan membetulkannya dengan cepat.

Pembangun digalakkan untuk mempertimbangkan dengan teliti antara pertukaran kependaman berbanding ketepatan. Merangkai berbilang langkah atau menambah gelung penilai boleh meningkatkan kualiti dengan ketara tetapi juga akan meningkatkan masa tindak balas dan penggunaan token. Pemaralan boleh membantu mendapatkan semula kelajuan, tetapi hanya apabila tugasan benar-benar bebas.

Kerja masa hadapan dalam ekosistem Spring AI akan memperdalam keupayaan sekitar komposisi corak, strategi memori lanjutan dan penyepaduan alat. Menghasilkan pelbagai corak—seperti rantaian, penghalaan dan gelung penilai—membolehkan anda membina ejen sofistikated yang masih boleh difahami. Pengurusan memori lanjutan meneroka konteks yang berterusan, tetingkap konteks yang cekap dan pengekalan pengetahuan jangka panjang.

Integrasi Alat dan Protokol Konteks Model (MCP) merupakan satu lagi bidang aktif. Antara muka piawai untuk alatan luaran dan protokol yang lebih kaya untuk konteks model bermakna ejen boleh mencapai perkhidmatan, API dan sumber data anda dengan selamat dan fleksibel, semuanya di bawah tadbir urus dan susunan kebolehcerapan anda.

AI Musim Bunga dalam platform yang lebih luas: Penyelesaian AI Gen Tanzu

Bagi organisasi yang membina berasaskan susunan Tanzu VMware, Spring AI turut menyokong Tanzu Gen AI Solutions. Tanzu AI Server, yang dikuasakan oleh Spring AI, menawarkan persekitaran sedia pengeluaran untuk menggunakan aplikasi AI pada Platform Tanzu dengan keselamatan, tadbir urus dan kebolehskalaan gred perusahaan.

Integrasi ini memudahkan akses kepada model seperti Amazon Bedrock Nova melalui antara muka terpadu. Platform ini menyeragamkan akses, dasar keselamatan dan perkakasan operasi daripada setiap pasukan yang memasang sambungan modelnya sendiri. Spring AI mengendalikan kebolehgunaan model, manakala Tanzu menyediakan infrastruktur, penskalaan automatik dan kebolehcerapan yang mantap yang anda harapkan daripada platform Kubernetes moden.

Oleh kerana Spring AI bertanggungjawab untuk abstraksi peringkat aplikasi, pasukan boleh beralih antara penyedia atau menerima pakai model baharu tanpa menulis semula logik perniagaan mereka. Kebolehsuaian itu adalah penting dalam landskap AI yang bergerak pantas di mana model baharu muncul dengan kerap dan harga atau keupayaan boleh berubah dengan cepat.

Ciri keselamatan dan tadbir urus dalam Tanzu Gen AI Solutions membungkus aplikasi AI ini dalam kawalan perusahaan yang sama yang digunakan untuk mikroservis lain. Dasar, kawalan akses, jejak audit dan perkakasan pematuhan meluas secara semula jadi kepada beban kerja LLM, menjadikannya lebih sesuai untuk menjalankan kes penggunaan yang sensitif atau dikawal selia.

Semua lapisan ini—rangka kerja, buku, corak dan platform—bertumpu ke arah matlamat yang sama: membolehkan pembangun Spring menambah ciri AI bernilai tinggi seperti pembantu maya, carian pintar, ringkasan teks dan cadangan terus ke dalam aplikasi Java tanpa mengorbankan kebolehpercayaan atau kawalan. Dengan Spring AI in Action sebagai panduan praktikal anda dan Spring AI sebagai tulang belakang kejuruteraan anda, anda boleh beralih daripada eksperimen kepada perkhidmatan berkuasa AI yang mantap sambil kekal dalam ekosistem Spring yang telah anda ketahui dengan baik.

comprobar dengan AWS adalah caído
artikel berkaitan:
Komprobar AWS ini adalah: keadaan, sebab dan perubahan nyata
Related posts: