டெவலப்பர்கள் ஜெமினி 3.5 லைவ் டிரான்ஸ்லேட்டைப் பொது முன்னோட்டத்தில் அணுகலாம்.
Photo Credit: Google
கூகுள் நிறுவனம் புதன்கிழமை அன்று 'ஜெமினி 3.5 லைவ் டிரான்ஸ்லேட்' (Gemini 3.5 Live Translate) என்ற தனது அதிநவீன பேச்சுக்கு-பேச்சு (speech-to-speech) மொழிபெயர்ப்பு மாதிரியை அறிமுகப்படுத்தியது. இது மிகவும் இயல்பான பன்மொழி உரையாடல்களை சாத்தியமாக்கும் வகையில் வடிவமைக்கப்பட்டுள்ளதாக கூகுள் கூறுகிறது. இந்நிறுவனத்தின் கூற்றுப்படி, இந்த புதிய AI மாதிரியால் 70-க்கும் மேற்பட்ட மொழிகளைக் கண்டறிந்து, மொழிபெயர்க்கப்பட்ட பேச்சை உருவாக்க முடியும். இதன் விளைவாக, பேசுபவரின் குரல் தொனி (tone), வேகம் (pacing) மற்றும் உச்சரிப்பு ஏற்ற இறக்கங்களை (intonation) அப்படியே தக்கவைத்துக்கொண்டு, தொடர்ச்சியான நிகழ்நேர மொழிபெயர்ப்புகளை வழங்க முடிகிறது. ஜெமினி 3.5 லைவ் டிரான்ஸ்லேட் வசதியானது கூகுள் டிரான்ஸ்லேட், கூகுள் மீட், கூகுள் AI ஸ்டுடியோ மற்றும் டெவலப்பர்களுக்கான ஜெமினி லைவ் API ஆகியவற்றில் தற்போது பயன்பாட்டிற்கு வந்துள்ளது.
கூகுள் தனது வலைப்பதிவு (blog) பக்கத்தில், ஜெமினி 3.5 லைவ் டிரான்ஸ்லேட் என்பது தனது மொழிபெயர்ப்பு முயற்சிகளின் அடுத்தகட்ட நடவடிக்கை என்று வலியுறுத்தியுள்ளது. இந்நிறுவனத்தின் ஆரம்பகால இயந்திர கற்றல் (machine learning) சோதனைகளில் ஒன்றாக கிட்டத்தட்ட இரண்டு தசாப்தங்களுக்கு முன்பே இந்த முயற்சிகள் தொடங்கின. இது பன்மொழி கூட்டங்கள், நேரடி ஒளிபரப்புகள், பாடங்கள், வாடிக்கையாளர் சேவை தொடர்புகள் மற்றும் நிகழ்நேர மொழிபெயர்ப்பு விளக்கங்களுக்கு (real-time interpretation) மிகவும் உகந்தது என்று நிறுவனம் கூறுகிறது.
கூகுள் நிறுவனத்தின் கூற்றுப்படி, ஜெமினி 3.5 லைவ் டிரான்ஸ்லேட் மிகக் குறைந்த காலதாமதத்துடன் நேரடி மொழிபெயர்ப்பைக் கையாள்கிறது. மேலும், ஆடியோ நிகழ்நேரத்தில் ஸ்ட்ரீம் செய்யப்படும்போதே அதைச் செயலாக்கி, அசல் பேசுபவருக்கு சில வினாடிகள் பின்னடைவில் மொழிபெயர்க்கப்பட்ட ஆடியோவை உருவாக்குகிறது. பாரம்பரியமாக முறை வாரியாக (turn-based) மொழிபெயர்க்கும் அமைப்புகளில் ஏற்படும் தேவையற்ற இடைநிறுத்தங்களை (pauses) இது தவிர்க்கிறது என்றும் நிறுவனம் தெரிவித்துள்ளது.
இந்த புதிய பேச்சுக்கு-பேச்சு மொழிபெயர்ப்பு மாதிரி, 70-க்கும் மேற்பட்ட மொழிகளை அடையாளம் கண்டு அவற்றுக்கிடையே தானாகவே மாறக்கூடியது என்று கூகுள் கூறுகிறது. இது மொழியமைப்புகளை கைமுறையாக (manually) மாற்றியமைக்க வேண்டிய அவசியத்தை நீக்குகிறது. சத்தம் நிறைந்த மற்றும் கணிக்க முடியாத சூழல்களிலும் ஜெமினி 3.5 லைவ் டிரான்ஸ்லேட் திறம்பட செயல்படும் என்று கூறப்படுகிறது.
மேம்படுத்தப்பட்ட மொழிபெயர்ப்பு திறன்கள் கூகுள் மீட் (Google Meet) செயலிக்கும் வரவுள்ளதாக நிறுவனம் அறிவித்துள்ளது. லைவ் டிரான்ஸ்லேட் போலவே, இந்த செயலியும் 70-க்கும் மேற்பட்ட மொழிகளில் மொழிபெயர்ப்பை ஆதரிக்கும். இது முந்தைய ஐந்து மொழிகள் என்ற வரம்பை விட குறிப்பிடத்தக்க வளர்ச்சியாகும். இது தவிர, இந்த தொழில்நுட்ப நிறுவனமானது ஜெமினி 3.5 லைவ் டிரான்ஸ்லேட் வசதியை ஆண்ட்ராய்டு மற்றும் iOS தளங்களில் உள்ள கூகுள் டிரான்ஸ்லேட் செயலிக்கும் கொண்டு வருகிறது. இது லைவ் டிரான்ஸ்லேட் மூலம் கிடைக்கும், மேலும் மொழிபெயர்க்கப்பட்ட பேச்சை அதனுடன் இணைக்கப்பட்ட இணக்கமான (compatible) ஹெட்போன்கள் மூலம் கேட்க முடியும்.
ஆண்ட்ராய்டில், கூகுள் 'லிசனிங் மோட்' (Listening Mode) என்ற வசதியை அறிமுகப்படுத்துகிறது. இது மொழிபெயர்க்கப்பட்ட ஆடியோவை நேரடியாக ஸ்மார்ட்போனின் இயர்பீஸ் (earpiece) வழியாகக் கேட்க அனுமதிக்கிறது.
AI மூலம் உருவாக்கப்படும் உள்ளடக்கங்கள் (content) குறித்த கவலைகளைக் கையாளும் விதமாக, ஜெமினி 3.5 லைவ் டிரான்ஸ்லேட் மூலம் உருவாக்கப்படும் அனைத்து ஆடியோக்களிலும் நிறுவனத்தின் வாட்டர்மார்க்கிங் தொழில்நுட்பமான 'சிந்த்ஐடி' (SynthID) பதிக்கப்பட்டுள்ளது என்று நிறுவனம் குறிப்பிட்டுள்ளது. இது உருவாக்கப்பட்ட ஆடியோவில் நேரடியாக ஒருங்கிணைக்கப்படும் வகையில் வடிவமைக்கப்பட்டுள்ளது, மேலும் இது AI-ஆல் உருவாக்கப்பட்ட உள்ளடக்கங்களை அடையாளம் காண உதவுகிறது.
டெவலப்பர்கள் ஜெமினி லைவ் API மற்றும் கூகுள் AI ஸ்டுடியோ மூலம் பொது முன்னோட்டமாக (public preview) ஜெமினி 3.5 லைவ் டிரான்ஸ்லேட்டை அணுகலாம். டெவலப்பர்கள் குரல் மொழிபெயர்ப்பு செயலிகளை மிகவும் எளிதாக உருவாக்கவும் பயன்படுத்தவும் உதவும் வகையில், Agora, Fishjam, LiveKit, Pipecat மற்றும் Vision Agents உள்ளிட்ட தளங்களுடனான ஒருங்கிணைப்புகளை கூகுள் முன்னிலைப்படுத்தியுள்ளது. இந்த AI மாதிரி இன்று முதல் உலகளவில் ஆதரிக்கப்படும் கூகுள் தயாரிப்புகளில் பயன்பாட்டிற்கு வருகிறது.
புதுப்புது தொழில்நுட்ப செய்திகள், அறிமுகமாகும் கருவிகள் பற்றிய விமர்சனங்கள் எல்லாவற்றையும் உடனுக்குடன் தமிழில் பெற பேஸ்புக் மற்றும் ட்விட்டர் NDTV Tamilஐ பின் தொடருங்கள்.
குடியுரிமை ரோபோ. எனக்கு மின்னஞ்சல் அனுப்பினால், ஒரு மனிதர் பதிலளிப்பார்.
...மேலும்