ગૂગલની મોટી ક્રાંતિ: Google Meet અને સ્માર્ટફોન પર લાઈવ સંભળાશે વિદેશી ભાષાનું ગુજરાતી, ડીપફેક રોકવા ઓડિયોમાં હશે ખાસ ‘SynthID’

વિવિધ દેશો અને સંસ્કૃતિઓ વચ્ચે સદીઓથી નડતરરૂપ બનતી ભાષાની મર્યાદાઓને હંમેશા માટે ખતમ કરવા ટેક જાયન્ટ ગૂગલે (Google) એક ઐતિહાસિક અને ક્રાંતિકારી પગલું ભર્યું છે. કંપનીએ વૈશ્વિક સ્તરે તેનું અત્યાધુનિક સ્પીચ-ટુ-સ્પીચ ટ્રાન્સલેશન મોડેલ ‘જેમિની 3.5 લાઈવ ટ્રાન્સલેટ’ (Gemini 3.5 Live Translate) લોન્ચ કરી દીધું છે. આ નવું મોડેલ ૭૦ થી વધુ ભાષાઓને પળવારમાં ઓળખીને રિયલ ટાઈમમાં સચોટ અનુવાદ કરવાની અદભુત ક્ષમતા ધરાવે છે. આ ટેકનોલોજીની સૌથી મોટી ખાસિયત એ છે કે તે માત્ર શબ્દોનું રૂપાંતર નથી કરતી, પરંતુ બોલનાર વ્યક્તિના અવાજનો ટોન (સ્વર), તેની સ્પીડ અને હાવભાવને પણ ઓરિજિનલ રાખે છે.
કોઈ ખચકાટ નહીં, ઘોંઘાટ વચ્ચે પણ સુપરફાસ્ટ કામગીરી
ગૂગલે એક સત્તાવાર બ્લોગ પોસ્ટમાં જણાવ્યું છે કે, આ પ્રોજેક્ટ બે દાયકા પહેલા શરૂ થયેલા મશીન લર્નિંગ સંશોધનોનું આગામી આધુનિક ચરણ છે.
-
ઝીરો લેગ (Zero Lag): આ મોડેલ ઓડિયો સ્ટ્રીમ થવાની સાથે જ બેકગ્રાઉન્ડમાં અનુવાદ તૈયાર કરતું જાય છે. પરિણામે, મુખ્ય સ્પીકરના બોલ્યા પછી માત્ર ગણતરીની સેકન્ડોમાં જ સામેની વ્યક્તિને પોતાની ભાષામાં ઓડિયો સંભળાશે, જેથી વાતચીત દરમિયાન કોઈ કંટાળાજનક વિરામ કે ગેપ નહીં આવે.
-
સ્માર્ટ નોઈઝ કેન્સલેશન: આ મોડેલ એટલું પાવરફુલ છે કે આસપાસના ઘોંઘાટવાળા વાતાવરણમાં પણ સામેની ભાષા આપમેળે ઓળખી લે છે, જેના માટે યુઝરે કોઈ મેન્યુઅલ સેટિંગ્સ કરવાની જરૂર પડતી નથી.
Google Meet અને સ્માર્ટફોન યુઝર્સ માટે ગેમચેન્જર
આ ક્રાંતિકારી ટેકનોલોજીનો સૌથી મોટો ફાયદો ગૂગલ મીટ (Google Meet) ના યુઝર્સને મળશે. અગાઉ ગૂગલ મીટમાં માત્ર ૫ ભાષાઓમાં જ અનુવાદની સુવિધા હતી, જે હવે વધારીને ૭૦થી વધુ ભાષાઓની કરી દેવાઈ છે. બહુભાષી બિઝનેસ મીટિંગ્સ, ઈન્ટરનેશનલ વેબિનાર અને ઓનલાઈન ક્લાસિસ માટે આ ફીચર ગેમચેન્જર સાબિત થશે.
આ સુવિધા ટૂંક સમયમાં જ iOS, Android અને Google Translate એપમાં ઉપલબ્ધ કરાશે. એન્ડ્રોઇડ યુઝર્સ માટે ખાસ ‘લિસનિંગ મોડ’ (Listening Mode) લાવવામાં આવી રહ્યો છે, જેનાથી યુઝર હેડફોન ભરાવીને સીધો જ પોતાની માતૃભાષામાં લાઈવ અનુવાદ સાંભળી શકશે. વિદેશી ક્લાયન્ટ્સ સાથે ડીલ કરવા માટે આ વરદાનરૂપ સાબિત થશે.
સુરક્ષા કવચ: ડીપફેક રોકવા ઓડિયોમાં ‘SynthID’ વોટરમાર્ક
આજના સમયમાં AI-જનરેટેડ કન્ટેન્ટ અને ડીપફેક ઓડિયોના દુરુપયોગને લઈને ઉઠતી ચિંતાઓ પર ગૂગલે મોટો ખુલાસો કર્યો છે. કંપનીએ સ્પષ્ટ કર્યું છે કે, જેમિની ૩.૫ લાઈવ ટ્રાન્સલેટ દ્વારા જનરેટ થનારા તમામ ઓડિયોમાં ગૂગલની પોતાની ખાસ સેફ્ટી ટેકનોલોજી ‘SynthID વોટરમાર્ક’ એમ્બેડેડ (સામેલ) હશે. આ ડિજિટલ વોટરમાર્કના લીધે ભવિષ્યમાં સરળતાથી ટ્રેક કરી શકાશે કે આ અવાજ કોઈ અસલી માણસનો નથી પણ AI દ્વારા તૈયાર કરવામાં આવ્યો છે.હાલમાં ડેવલપર્સ અને ટેક પ્રોફેશનલ્સ માટે Gemini Live API અને Google AI સ્ટુડિયોના પબ્લિક પ્રિવ્યૂમાં આ મોડેલ એક્સેસ માટે ખુલ્લું મુકી દેવાયું છે.
- Advertisement -
- Advertisement -