गूगल जेमिनी में होने जा रहे हैं बड़े बदलाव: इंटरफेस से लेकर ऑडियो मॉडल तक सब कुछ होगा नया

ee685c12face7581b98a71291d2ab4a1.jpg

गूगल अपने एआई प्लेटफॉर्म जेमिनी को अगले स्तर पर ले जाने के लिए पूरी तरह तैयार है। हाल ही में सामने आई जानकारी और गूगल की नई घोषणाओं को देखें, तो कंपनी न केवल जेमिनी ऐप के यूजर इंटरफेस (UI) को सुधार रही है, बल्कि इसके ऑडियो मॉडल्स को भी इंसान जैसा नेचुरल बनाने पर काम कर रही है। ये अपडेट्स आम यूजर्स और डेवलपर्स दोनों के अनुभव को पूरी तरह बदल सकते हैं।

‘My Stuff’ सेक्शन का नया और सुलझा हुआ रूप

वर्तमान में जेमिनी ऐप का इस्तेमाल करने वालों के लिए एक बड़ी समस्या यह है कि उनकी सारी पुरानी फाइलों और चैट का रिकॉर्ड ‘My Stuff’ में सिर्फ़ तारीख के हिसाब से दिखता है। इसे ढूंढना कई बार मुश्किल हो जाता है। Android Authority ने ऐप के एक बीटा वर्जन (16.50.55.sa.arm64) की छानबीन में पाया कि गूगल अब इसे श्रेणियों में बांटने की तैयारी कर रहा है। आने वाले अपडेट में आपको ‘मीडिया’ और ‘डॉक्यूमेंट्स’ के अलग-अलग फोल्डर मिल सकते हैं, जो इस बात पर निर्भर करेगा कि आपने चैटबॉट के साथ किस तरह का कंटेंट बनाया है।

‘परचेजेज़’ सेक्शन और हैप्टिक फीडबैक

ऐप के रीडिजाइन में एक दिलचस्प चीज़ ‘Purchases’ यानी ‘खरीददारी’ नाम का सेक्शन है। हालांकि अभी यह स्पष्ट नहीं है कि इसका सटीक उपयोग क्या होगा, लेकिन कयास लगाए जा रहे हैं कि नवंबर में लॉन्च किए गए एआई शॉपिंग फीचर्स के तहत की गई खरीददारी का ब्यौरा यहाँ रखा जा सकता है। इसके अलावा, कुछ पुराने यूजर्स को याद होगा कि जेमिनी का प्रॉम्प्ट बार पहले कैसा दिखता था; गूगल शायद उसी पुराने लेआउट को वापस लाने का विचार कर रहा है।

इसी कड़ी में, ऐप के अनुभव को और बेहतर बनाने के लिए ‘हैप्टिक फीडबैक’ भी जोड़ा जा सकता है। इसका मतलब है कि जब आप कोई प्रॉम्प्ट डालेंगे या जेमिनी जवाब तैयार कर लेगा, तो आपको फोन में हल्का सा वाइब्रेशन महसूस होगा। यह एक छोटा लेकिन उपयोगी फीचर है, हालाँकि उम्मीद है कि गूगल इसे चालू या बंद करने का विकल्प भी देगा।

जेमिनी 2.5: बातचीत होगी अब और भी असली

सिर्फ़ ऐप की शक्ल-सूरत ही नहीं बदल रही, बल्कि जेमिनी की ‘आवाज़’ और ‘समझ’ में भी भारी बदलाव किया गया है। गूगल ने अपने अपडेटेड ‘जेमिनी 2.5 फ्लैश नेटिव ऑडियो’ मॉडल को पेश कर दिया है। इसका मुख्य उद्देश्य एआई के साथ बातचीत को इतना स्वाभाविक बनाना है कि यूजर को मशीनीपन का अहसास न हो। यह मॉडल अब गूगल एआई स्टूडियो और जेमिनी लाइव पर उपलब्ध है, जिससे डेवलपर्स और एंटरप्राइज यूजर्स इसका लाभ उठा सकते हैं।

तकनीकी सुधार और बेहतर समझ

तकनीकी नज़रिए से देखें तो नए ऑडियो मॉडल में तीन बड़े सुधार किए गए हैं। पहला, यह मॉडल अब जटिल निर्देशों को 90% सटीकता के साथ समझ सकता है, जो पहले के मुकाबले काफी बेहतर है। दूसरा, ‘फंक्शन कॉलिंग’ में सुधार के चलते यह बातचीत के दौरान ही रियल-टाइम जानकारी जुटा सकता है और उसे बिना रुकावट के जवाब में शामिल कर सकता है।

तीसरा और सबसे महत्वपूर्ण सुधार बातचीत के प्रवाह में है। अब जेमिनी पिछली कही गई बातों के संदर्भ (Context) को बेहतर ढंग से याद रखता है। इसका फायदा शॉपिफाई (Shopify) और यूडब्ल्यूएम (UWM) जैसी बड़ी कंपनियों को मिल रहा है, जहाँ एआई रिसेप्शनिस्ट और कस्टमर सर्विस एजेंट अब शोरगुल वाले माहौल में भी मुख्य वक्ता की आवाज़ पहचान लेते हैं और भावनाओं के साथ जवाब देते हैं।

रियल-टाइम अनुवाद की नई दुनिया

गूगल ने ‘लाइव स्पीच ट्रांसलेशन’ के ज़रिए भाषा की बाधाओं को तोड़ने की दिशा में एक बड़ा कदम उठाया है। यह नया फीचर हेडफोन के जरिए रियल-टाइम में एक भाषा को दूसरी भाषा में अनुवाद करने की क्षमता रखता है। खास बात यह है कि यह सिर्फ़ शब्दों का अनुवाद नहीं करता, बल्कि बोलने वाले के लहजे, उतार-चढ़ाव और पिच को भी बरकरार रखता है।

उदाहरण के तौर पर, यदि आप अंग्रेजी बोलते हैं और किसी हिंदी भाषी व्यक्ति से बात करना चाहते हैं, तो जेमिनी दोनों तरफ से अनुवाद संभालेगा। जब आप बोलेंगे तो सामने वाले को हिंदी सुनाई देगी और जब वह बोलेगा तो आपको अंग्रेजी, वो भी बिना किसी देरी के। यह फीचर गूगल ट्रांसलेट ऐप में रोल आउट होना शुरू हो गया है, जो वैश्विक संचार को पूरी तरह से बदल सकता है।