
यदि आप एक स्थापित करने के बारे में सोच रहे हैं रास्पबेरी पाई के साथ AI सहायकआप सही जगह पर हैं: आज, आवाज, दृष्टि और भाषा मॉडल का संयोजन इन छोटे एसबीसी में पहले से ही व्यवहार्य है, रास्पबेरी पाई 4 और अधिक शक्तिशाली रास्पबेरी पाई 5 दोनों के साथ। ऐसी वास्तविक परियोजनाएं हैं जो इसे प्रदर्शित करती हैं, और आधिकारिक सहायक उपकरण भी हैं जो इसे एक कदम आगे ले जाने के लिए एआई त्वरण लाते हैं।
इस लेख में आपको एक बहुत ही संपूर्ण अवलोकन मिलेगा: Pi 4 पर आधारित एक आवाज-सक्रिय होम असिस्टेंट से लेकर जैसे उपकरण VOSK और ओलामा...एक Pi 5 तक जो Qwen3:1.7bo और Gemma3:1b जैसे कॉम्पैक्ट मॉडल के साथ वेक वर्ड, ट्रांसक्रिप्शन और लोकल इन्फ़रेंस चलाता है। आप यह भी देखेंगे कि Hailo-8L NPU वाला AI किट Pi 5 में कैसे फिट बैठता है, पहचान और TTS के लिए कौन सी लाइब्रेरी का इस्तेमाल करना है, और घर और कार्यस्थल पर सुरक्षा को प्राथमिकता देना क्यों ज़रूरी है।
रास्पबेरी पाई के साथ एआई सहायक क्यों बनाएं?
रास्पबेरी पाई पर एक स्मार्ट सहायक आपको कम लागत और न्यूनतम बिजली खपत के साथ उपकरणों को नियंत्रित करने, प्रश्नों का उत्तर देने और दिनचर्या को स्वचालित करने की सुविधा देता है; दूसरे शब्दों में, यह एक आदर्श मंच है सीखें, प्रोटोटाइप बनाएं और तैनात करें आवाज और भाषा संबंधी कार्य, हमेशा क्लाउड पर निर्भर हुए बिना।
रास्पबेरी पाई के साथ आप माइक्रोफोन, कैमरा और छोटी स्क्रीन को एकीकृत कर सकते हैं, साथ ही पायथन, जावा या सी++ में प्रोग्राम भी कर सकते हैं; इससे आवाज-सक्रिय स्थिति पैनल से लेकर चेहरे की पहचान के साथ एक्सेस कंट्रोल सिस्टम और यहां तक कि एक होम बॉट तक की परियोजनाओं के लिए दरवाजे खुल जाते हैं। सुनें, व्याख्या करें और कार्य करें आपके आदेशानुसार.
रास्पबेरी पाई 4 बनाम रास्पबेरी पाई 5: शक्ति और संभावनाएं
रास्पबेरी पाई 4 ने प्रदर्शित किया कि यदि आप सही स्टैक चुनते हैं तो स्थानीय वॉयस असिस्टेंट संभव है; हालांकि, रास्पबेरी पाई 5 न केवल सीपीयू और जीपीयू को गति देता है, बल्कि उच्च प्रदर्शन वाले सहायक उपकरणों के लिए पीसीआईई कनेक्टिविटी भी जोड़ता है और पोर्ट और बैंडविड्थ में सुधार करता है, इसलिए समग्र अनुभव अधिक सहज हो जाता है.
Pi 5 के स्पेसिफिकेशन्स में, इसकी प्रमुख विशेषताओं में 2,4 GHz तक का ARM Cortex-A76 प्रोसेसर, 8 GB तक LPDDR4X रैम, वाई-फाई 5, ब्लूटूथ 5.0/BLE, और 60 Hz पर 4K आउटपुट वाले दो माइक्रो-HDMI पोर्ट शामिल हैं। मज़बूत सेंसर्स के साथ, यह असिस्टेंट को एक साथ कई कामों को आसानी से संभालने और बेहतर प्रदर्शन करने में मदद करता है। कम विलंबता आवाज बातचीत में.
ASRAI: Pi 4 के साथ एक वास्तविक परियोजना जो गोपनीयता और नियंत्रण पर केंद्रित है
एक चतुर निर्माता ने ASRAI नामक एक वॉयस-एक्टिवेटेड असिस्टेंट बनाया है, जो रास्पबेरी पाई 4 मॉडल B पर आधारित है, जिसमें 3,5 इंच का GPIO डिस्प्ले और सोनी प्लेस्टेशन आई कैमरा है। असली रत्न तो प्लेस्टेशन आई है: इसमें चार-माइक्रोफोन ऐरे है जिसे पाई के लिए आसानी से अलग किया जा सकता है और सेकंड-हैंड बाज़ार में यह लगभग मुफ़्त में मिल जाता है, जिससे यह एक बेहतरीन सौदा बन जाता है। ऑडियो कैप्चर के लिए सौदा बुनियादी बीम गठन के साथ.
इस परियोजना में, Pi 4 ऑफ़लाइन स्पीच रिकग्निशन के लिए स्थानीय रूप से VOSK चलाता है और नेटवर्क के माध्यम से लेखक के अपने पीसी पर होस्ट किए गए LLM से Ollama के माध्यम से OpenAI-संगत API पॉइंट के ज़रिए जुड़ता है। इस कनेक्शन को कहीं से भी काम करने के लिए, निर्माता ने NordVPN के Meshnet को सक्षम किया, जिससे एक निजी और सर्वव्यापी लिंक सेवाओं को सीधे इंटरनेट पर उजागर किए बिना।
विचार यह है कि कैप्चर, वेक वर्ड और स्थानीय ट्रांसक्रिप्शन को Pi पर डाउनलोड किया जाए वोस्क, जबकि भाषा निर्माण को किसी अन्य मशीन पर OpenAI-प्रकार API का उपयोग करके अधिक शक्तिशाली मॉडल द्वारा नियंत्रित किया जाता है ओलामा और मेशनेट के कारण सुलभ है; इस तरह, प्रदर्शन और गोपनीयता संतुलित हैं।
"मानवीय" स्पर्श के लिए, इस परियोजना में छोटे पर्दे पर सोने या सुनने के लिए चित्र शामिल हैं। अगर आप इसे दोहराने में रुचि रखते हैं, तो निर्माता आवश्यक संसाधन साझा करता है, और यह मददगार होगा... 3D प्रिंटर और एक वेल्डर माइक्रोफोन सरणी की असेंबली और समायोजन के लिए।
इस पहल को विशेष मीडिया द्वारा प्रमुखता से प्रचारित किया गया और यह डिज़ाइन दर्शन में रास्पी जैसे अन्य दृष्टिकोणों की याद दिलाता है: स्थानीय पहचान और मॉड्यूलर ऑर्केस्ट्रेशन। यहाँ तक कि उन करीबी सहयोगियों का भी उल्लेख है जिन्होंने अपने पाई को एआई सहायक और पीढ़ीगत छलांग लगाने पर विचार करने वालों को मार्गदर्शन देने के लिए रास्पबेरी पाई 5 पर विभिन्न एआई के प्रदर्शन का विश्लेषण किया।
रास्पबेरी पाई 5 के लिए आधिकारिक एआई किट: त्वरण का तेज़ रास्ता
अगर आप इसे अगले स्तर पर ले जाना चाहते हैं, तो Raspberry Pi 5 के लिए AI किट, M.2 HAT+ से जुड़े पहले से इंस्टॉल किए गए M.2 2242 के ऊपर एक Hailo-8L NPU जोड़ता है। यह संयोजन कुशल एज इंफ़ेरेंस के लिए 13 TOPS तक प्रदान करता है, CPU को भारी कार्यभार से मुक्त करता है और सहायक को विज़न या ऑडियो मॉडल चलाने की अनुमति देता है। कम विलंबता और खपत.
पैकेज में शामिल हैं: एक स्टैकेबल GPIO हेडर, स्पेसर, स्क्रू, AI बोर्ड को Pi 5 के PCIe बस से जोड़ने के लिए एक लचीली रिबन केबल, और तापमान को नियंत्रण में रखने के लिए एक उपयुक्त हीटसिंक। भौतिक इंस्टॉलेशन सरल है, और फिर सॉफ़्टवेयर तैनात किया जाता है। रास्पबेरी पाई ओएस पर apt.
- Hailo‑8L NPU के साथ Hailo AI मॉड्यूल
- रास्पबेरी पाई 5 के लिए रास्पबेरी पाई M.2 HAT+
- मॉड्यूल और HAT+ के बीच पूर्व-स्थापित थर्मल पैड
- स्पेसर और स्क्रू के साथ माउंटिंग किट
- स्टैकेबल 16 मिमी GPIO कनेक्टर और फ्लैट PCIe केबल
रास्पबेरी पाई ओएस वातावरण में हेलो डिवाइस का एकीकरण परिपक्व है: यह इसके साथ काम करता है libcamera, rpicam‑apps और picamera2 और सॉफ्टवेयर इकोसिस्टम (हेलो, हेलोआरटी, और हेलोटैपस ड्राइवर) सीधे पैकेज मैनेजर के ज़रिए इंस्टॉल हो जाता है। इस तरह, कंप्यूटर विज़न असिस्टेंट (जैसे, चेहरा या हावभाव पहचान) की नींव तैयार हो जाती है। न्यूनतम घर्षण.
उपयोग के मामले: घरेलू नियंत्रण से लेकर संवादात्मक सहायक तक
Pi 5 और AI किट के साथ आप चेहरे की पहचान करने वाले एक्सेस कंट्रोल सिस्टम से लेकर कुछ भी सेट कर सकते हैं संवादी गृह सहायक "हैंड्स-फ्री।" बुनियादी नेविगेशन वाला एक सरल रोबोट जो ध्वनि आदेश प्राप्त करता है और प्रतिक्रिया देता है भाषण संश्लेषण लाउडस्पीकर के माध्यम से।
अगर आप एक्सेलरेटर नहीं चाहते, तो ASRAI (लोकल स्पीच प्रोसेसिंग और रिमोट LLM) जैसा हाइब्रिड तरीका या नवीनतम कॉम्पैक्ट मॉडल वाला एक पूर्ण-स्थानीय तरीका भी कारगर हो सकता है। एक सहज अनुभव सुनिश्चित करने के लिए मॉडल के आकार, क्वांटाइज़ेशन और ऑडियो पाइपलाइन को ठीक से ट्यून करना ज़रूरी है। चुस्त और स्थिर उपलब्ध हार्डवेयर पर.
रास्पबेरी पाई पर आवाज़ और भाषा के लिए प्रमुख सॉफ़्टवेयर
ऑफ़लाइन स्पीच रिकग्निशन के लिए, रास्पबेरी पाई की तुलना में VOSK एक सुरक्षित विकल्प है। पॉकेटस्फिंक्स जैसे विकल्प भी उपयोगी हैं, और अगर आप क्लाउड सेवाएँ पसंद करते हैं, तो गूगल स्पीच रिकग्निशन जैसे इंजनों के साथ एकीकरण भी उपलब्ध हैं; हालाँकि, कई परियोजनाएँ प्राथमिकता देती हैं गोपनीयता और कम विलंबताअतः स्थानीय प्रतिलेखन को बल मिलता है।
स्थानीय स्पीच सिंथेसिस के लिए, pyttsx3 बाहरी निर्भरताओं के बिना एक बुनियादी TTS प्रदान करता है। LLM घटक के संदर्भ में, Ollama "OpenAI संगत" एंडपॉइंट के साथ सर्विंग मॉडल को सरल बनाता है, जिससे कस्टम स्क्रिप्ट या मौजूदा क्लाइंट को कनेक्ट करना आसान हो जाता है। इस दृष्टिकोण से, आपका Pi पाइपलाइन को व्यवस्थित कर सकता है और जनरेशन को किसी [विशिष्ट एप्लिकेशन/टूल - संदर्भ आवश्यक] को सौंप सकता है। सबसे शक्तिशाली टीम.
एक 100% Pi 5 मिनी-एजेंट: वेक वर्ड, ट्रांसक्रिप्शन और स्थानीय अनुमान
एक उत्साही व्यक्ति ने प्रदर्शित किया है कि 16 जीबी रैम वाला रास्पबेरी पाई 5 यह पूरा चक्र चला सकता है: VOSK के साथ ट्रिगर वर्ड डिटेक्शन, फ़ास्टर-व्हिस्पर के साथ ट्रांसक्रिप्शन, और Gemma3:1b द्वारा Qwen3:1.7 जैसे कॉम्पैक्ट LLM के साथ अनुमान, ये सब स्थानीय रूप से। यह एक अनुकूलन चुनौती है, लेकिन इसे किया जा सकता है; इसका दस्तावेज़ीकरण करने वाला रिपॉजिटरी और ब्लॉग पोस्ट एक बेहतरीन संसाधन हैं। सीखने के लिए मेरा फाइन-ट्यूनिंग और संसाधन प्रबंधन पर।
इस उदाहरण से सीख स्पष्ट है: अच्छी तरह से चुने गए मॉडल, क्वांटाइज़ेशन और एक सुव्यवस्थित पाइपलाइन के साथ, Pi 5 उचित समय में प्रतिक्रिया देता है। यदि परियोजना को अधिक प्रसंस्करण शक्ति की आवश्यकता है, तो धारणा कार्यों (दृश्य, श्रव्य) के लिए Hailo-8L का उपयोग करने और एक हल्के स्थानीय LLM को बनाए रखने या किसी पर निर्भर रहने का विकल्प हमेशा मौजूद रहता है। रीमोट सर्वर संगत।
आरंभ करना: ऑपरेटिंग सिस्टम, लाइब्रेरीज़ और प्रोजेक्ट संरचना
संसाधनों का अधिकतम उपयोग करने के लिए, कई डेवलपर रास्पबियन (रास्पबेरी पाई ओएस) के लाइट संस्करण की सलाह देते हैं, जो सेवाओं और बेस मेमोरी के उपयोग को कम करता है। इसके बाद, अपनी ज़रूरत के अनुसार स्पीच, टीटीएस और ऑर्केस्ट्रेशन लाइब्रेरीज़ इंस्टॉल करें; पायथन के साथ, एक कार्यात्मक और स्केलेबल प्रोटोटाइप बनाना आसान है। अच्छी तरह से अलग किए गए मॉड्यूल.
के लिए एक नुस्खा बूट सामान्यतः इसमें शामिल हैं:
- रास्पबेरी पाई ओएस लाइट स्थापित करें और सिस्टम अपडेट लागू करें।
- ऑडियो (माइक्रोफोन और स्पीकर), कैमरा (यदि लागू हो) कॉन्फ़िगर करें, और रिकॉर्ड/एप्ले के साथ परीक्षण करें।
- इस तरह के पैकेज स्थापित करें वाक् पहचान (यदि आप क्लाउड सेवाओं का उपयोग करने जा रहे हैं) या ऑफ़लाइन के लिए VOSK/PocketSphinx, और pyttsx3 स्थानीय टीटीएस के लिए.
- अपना एलएलएम बैकएंड चुनें: ओलामा और छोटे मॉडल के साथ स्थानीय, या संगत रिमोट।
- पायथन में मुख्य लूप को कोड करें: सुनें, लिप्यंतरित करें, व्याख्या करें (एनएलपी) और क्रियाएं निष्पादित करें।
एनएलपी परत में, आप सरल उद्देश्यों और नियमों से शुरुआत कर सकते हैं, और जैसे-जैसे आप आगे बढ़ते हैं, एलएलएम को शामिल कर सकते हैं। कमांड निष्पादन के लिए, प्रत्येक डिवाइस या सेवा (उदाहरण के लिए, लाइट, क्लाइमेट कंट्रोल, रिमाइंडर) के लिए एडेप्टर निर्धारित करें, ताकि सहायक एक स्वच्छ और विस्तार योग्य कोर.
कनेक्टिविटी और ऑर्केस्ट्रेशन: एक अच्छे नेटवर्क के साथ सब कुछ एक साथ फिट बैठता है
Pi में वाई-फाई 5 और ब्लूटूथ 5.0/BLE की सुविधा है, जिससे यह लाइट बल्ब, स्पीकर और सेंसर के साथ वायरलेस तरीके से संचार कर सकता है। जब बाहरी सेवाएँ या कई मशीनें शामिल होती हैं, तो नॉर्डवीपीएन के मेशनेट जैसा एक निजी नेटवर्क फ़ैब्रिक, Pi की ऑफ-साइट मॉडल सर्वर को दुनिया के सामने पोर्ट्स को उजागर किए बिना "देखने" की क्षमता को सरल बनाता है, जिससे यह सुरक्षित रहता है। नियंत्रण और सुरक्षा.
यदि आप विज़ार्ड को विभिन्न परिवेशों में परिनियोजित करने की योजना बना रहे हैं, तो अनुमान घटकों या मल्टीमीडिया पाइपलाइनों के लिए कंटेनरों पर विचार करें। अलग-अलग सेवाओं (एएसआर, टीटीएस, एलएलएम, ऑर्केस्ट्रेटर) वाली संरचना आपको घटकों को स्केल करने और कार्यभार को दूसरे नोड पर स्थानांतरित करने की अनुमति देगी। न्यूनतम प्रभाव बाकी सिस्टम में.
सुरक्षा: निगरानी हेतु सर्वोत्तम अभ्यास और कमजोरियाँ
एक सहायक हमेशा अपने आस-पास की गतिविधियों पर ध्यान देता रहता है और अन्य उपकरणों के साथ संचार करता रहता है, इसलिए साइबर सुरक्षा अत्यंत महत्वपूर्ण है। ज्ञात खतरों को कम करने के लिए सिस्टम और लाइब्रेरी को अद्यतन रखना शुरू करें, और उपकरणों के बीच सभी संचारों के लिए एन्क्रिप्शन सक्षम करें; IoT नेटवर्क को घर के बाकी हिस्सों से अलग रखना एक उपाय है। सस्ता और प्रभावी.
IoT और मिडलवेयर के बारे में सलाह की समीक्षा करना और सार्वजनिक कमजोरियों पर ध्यान देना उचित है, जैसे सीवीई‑2021‑22945 o सीवीई‑2021‑22946 अन्य बातों के अलावा, ये निर्भरताओं का ऑडिट करने और पैच को तुरंत लागू करने के लिए रिमाइंडर का काम करते हैं। इसका उद्देश्य यह है कि आपका सहायक बोझ बने बिना मददगार बने। एक जोखिम वेक्टर.
कैमरा और कंप्यूटर विज़न के साथ एकीकरण
अगर आपके असिस्टेंट में कैमरा है, तो Pi 5 libcamera और rpicam-apps के साथ अच्छी तरह काम करता है; इसके अलावा, picamera2 वीडियो स्ट्रीम तक प्रोग्रामेटिक एक्सेस की सुविधा देता है। Hailo-8L के साथ, ऑब्जेक्ट डिटेक्शन और फेशियल रिकग्निशन जैसे काम तेज़ और कुशल हो जाते हैं, जिससे कई परिदृश्य संभव हो जाते हैं। अभिगम नियंत्रण या संदर्भ-संवेदनशील होम ऑटोमेशन।
एक आम तरीका यह है कि विज़न को Pi के पास ही रखा जाए और उच्च-स्तरीय व्याख्या का काम LLM को सौंप दिया जाए ("अगर आप X को पहचानते हैं, तो मुझसे पूछें कि क्या मुझे दरवाज़ा खोलना चाहिए")। सिर्फ़ मेटाडेटा या परिणाम शेयर करके, कच्ची तस्वीरें नहीं, आप गोपनीयता में सुधार करते हैं और जोखिम कम करते हैं। बैंडविड्थ ज़रूरी।
व्यावहारिक उदाहरण जो काम करते हैं
- Pi 4 पर ASRAI: PlayStation Eye माइक्रोफ़ोन (4 माइक्रोफ़ोन), 3,5-इंच GPIO डिस्प्ले, लोकल VOSK, Ollama के ज़रिए रिमोट LLM, और Meshnet के ज़रिए कहीं भी कनेक्टिविटी। इसके लिए 3D प्रिंटिंग और थोड़ी सोल्डरिंग की ज़रूरत होती है, लेकिन नतीजा एक सहायक उपकरण जैसा होता है। चुस्त और विवेकशील.
– Pi 5 "ऑल-इन-वन": VOSK के साथ वेक वर्ड, फ़ास्टर-व्हिस्पर के साथ ट्रांसक्रिप्शन, और Gemma3:1b द्वारा Qwen3:1.7 के साथ स्थानीय अनुमान। मुख्य बात अनुकूलन और उचित विलंबता बनाए रखने के लिए मॉडलों के आकार को सीमित करना है; संबंधित रिपॉजिटरी एक जीवित मार्गदर्शक अपनी परियोजना को समायोजित करने के लिए.
- एआई किट के साथ Pi 5: पहुंच के लिए चेहरे की पहचान, त्वरित दृष्टि मॉडल के साथ प्रासंगिक प्रतिक्रिया और बातचीत के लिए एक हल्का LLM; Hailo, HailoRT और HailoTappas ड्राइवर apt के माध्यम से इंस्टॉल करने योग्य और libcamera और picamera2 के साथ संगतता डिवाइस में ही एकीकृत रास्पबेरी पाई ओएस.
अच्छे विकास और रखरखाव अभ्यास
कोड को मॉड्यूल में संरचित करें: ऑडियो कैप्चर, एएसआर, एनएलपी, निष्पादन, टीटीएस, और, यदि लागू हो, तो विज़न। बाधाओं की पहचान करने के लिए उपयोगी लॉग और एक डीबग मोड जोड़ें। जोड़ते समय ब्रेकिंग रिग्रेशन से बचने के लिए बुनियादी परीक्षणों (जैसे, पूर्वनिर्धारित इंटेंट) को स्वचालित करें। नए कार्य.
हार्डवेयर की बात करें तो, पावर और वेंटिलेशन पर ध्यान दें, खासकर अगर आप NPU लगा रहे हैं या भारी लोड के साथ काम कर रहे हैं। एक अच्छा हीट सिंक और अच्छा एयरफ्लो थर्मल थ्रॉटलिंग को रोकता है और एक स्थिर अनुभव बनाए रखता है। निरंतर बातचीत.
समुदाय और नियम: अपनी परियोजनाओं को उचित तरीके से साझा करें
अगर आप अपने असिस्टेंट को Raspberry Pi कम्युनिटीज़ में प्रकाशित करने जा रहे हैं, तो याद रखें कि सिर्फ़ परिणाम दिखाने की बजाय, यह बताना कि आपने यह कैसे किया, सराहनीय है। स्पैम और किसी भी तरह के अपमानजनक व्यवहार से बचें, और हाँ, किसी भी तरह के असुरक्षित इलेक्ट्रिकल व्यवहार से बचें; और ज़्यादा सीखने के अलावा, आप एक सुरक्षित और सुरक्षित वातावरण बनाए रखेंगे। स्वस्थ वातावरण और सभी के लिए उपयोगी है।
जब आप साझा करते हैं, तो अपने हार्डवेयर, मुख्य चरणों, निर्भरताओं, ऑडियो सेटिंग्स और इस्तेमाल किए गए मॉडलों का दस्तावेज़ीकरण करें। इससे दूसरों को आपके काम को दोहराने में मदद मिलती है और मूल्यवान प्रतिक्रिया मिलती है; अंततः, यह सहयोग किसी भी अन्य तरीके की तुलना में आपके प्रोजेक्ट को तेज़ी से आगे बढ़ाता है। अलग-थलग चाल.
प्रदर्शन में क्या अपेक्षा करें और अपनी वास्तुकला का निर्णय कैसे करें
– अगर आप गोपनीयता और पूर्ण नियंत्रण चाहते हैं, तो स्थानीय ASR और TTS, और Pi 5 पर एक कॉम्पैक्ट LLM या अपने निजी Meshnet नेटवर्क पर Ollama द्वारा संचालित LLM चुनें। इस तरह आप एज-फर्स्ट काम करते हैं और वॉइस डेटा सुरक्षित रखते हैं। आपकी छत के नीचे.
– अगर आपको बेहतर जवाब चाहिए और क्लाउड इस्तेमाल करने में कोई दिक्कत नहीं है, तो रिमोट LLM इस अड़चन को दूर कर देता है। इसके बाद Pi एक ऑर्केस्ट्रेटर ब्रेन की तरह काम करता है, सेंसर्स और एक्चुएटर्स को नियंत्रित करता है और वॉइस सेशन को मैनेज करता है। स्वीकार्य विलंबता.
– अगर आपके सहायक को "देखने" की ज़रूरत है, तो Hailo-8L वाला AI किट सबसे अच्छा विकल्प है: एज विज़न के लिए 13 टॉप्स, apt के ज़रिए ड्राइवर, और Raspberry Pi OS द्वारा समर्थित एक इकोसिस्टम। इसे Pi के बाहर एक मिड-रेंज LLM के साथ मिलाएँ, और आपको एक शानदार अनुभव मिलेगा। गोल और संतुलित.
- यदि आप पूर्ण-स्थानीय सेटअप चुनते हैं, तो अनुकूलित मॉडल (Qwen3:1.7b, Gemma3:1b, या समकक्ष) चुनें और ऑडियो रूटिंग पर ध्यान दें; ट्रांसक्रिप्शन के लिए फास्टर व्हिस्पर और वेक वर्ड प्रोसेसिंग के लिए VOSK का उपयोग करना पहले से ही एक अच्छा विकल्प साबित हुआ है। व्यवहार्य मार्ग पाई 5 पर 16 जीबी के साथ।
अंततः, रास्पबेरी पाई के साथ एक एआई सहायक का निर्माण आसानी से उपलब्ध घटकों को जोड़ता है: पुन: उपयोग किए गए प्लेस्टेशन आई जैसे सस्ते हार्डवेयर, वीओएसके या फास्टर-व्हिस्पर जैसे सॉफ्टवेयर, ओलामा के माध्यम से ओपनएआई-संगत एंडपॉइंट्स, और यदि आवश्यक हो, तो पाई 5 पर हेलो-8एल का अतिरिक्त लाभ। सुरक्षा (अपडेट, अलग नेटवर्क, एन्क्रिप्शन) और स्पष्ट दस्तावेज़ीकरण पर ध्यान देने के साथ, विचार से पूरी तरह कार्यात्मक परियोजना तक जाना आसान है। कार्यात्मक सहायक जो लिविंग रूम या कार्यालय में अच्छा प्रदर्शन करता है।