Google เปิดตัว Gemini 3.5 Live Translate โมเดลแปลเสียงพูดแบบเรียลไทม์ รองรับมากกว่า 70 ภาษา เริ่มใช้งานใน Google Translate บน Android และ iOS พร้อมเตรียมขยายสู่ Google Meet และนักพัฒนาผ่าน Gemini Live APIในที่สุด Google เปิดตัว Gemini 3.5 Live Translate โมเดลใหม่สำหรับการแปลเสียงพูดแบบเรียลไทม์ หรือ Speech-to-Speech Translation ที่ออกแบบมาให้การแปลสดมีความลื่นไหลและเป็นธรรมชาติมากขึ้น พร้อมเริ่มใช้งานกับ Google Translate และเตรียมขยายสู่ Google MeetGemini 3.5 Live Translate เป็นโมเดลแปลเสียงพูดสดรุ่นใหม่ของ Google ที่ออกแบบมาเพื่อแก้จุดอ่อนของระบบแปลภาษาสดแบบเดิม ซึ่งมักต้องรอให้ผู้พูดพูดจบก่อน แล้วระบบจึงค่อยแปลออกมา แต่โมเดลใหม่นี้สามารถสร้างเสียงแปลได้อย่างต่อเนื่อง ทำให้การสนทนามีความลื่นไหลขึ้น ลดช่วงเงียบหรือจังหวะหน่วงที่ทำให้การพูดคุยดูไม่เป็นธรรมชาติการปรับปรุงครั้งสำคัญคือการเพิ่มระบบแปลภาษาสดแบบเดิมมักทำงานแบบ Turn-by-turn คือรอผู้พูดพูดจบก่อนจึงเริ่มแปล ซึ่งแม้จะแปลได้ถูกต้องขึ้นในบางกรณี แต่ทำให้บทสนทนามีช่วงเว้นวรรคและขาดความต่อเนื่องgemini-3.5-live-translate_batทำให้ Gemini 3.5 Live Translate ใช้วิธีสร้างเสียงแปลอย่างต่อเนื่อง โดยพยายามหาสมดุลระหว่างการรอข้อมูลบริบทเพื่อแปลให้ถูกต้อง และการแปลให้ทันจังหวะของผู้พูด ส่งผลให้เสียงแปลตามหลังผู้พูดเพียงไม่กี่วินาทีเรื่องจำนวนภาษาที่รองรับนั้น Google ระบุว่า Gemini 3.5 Live Translate สามารถตรวจจับภาษาได้มากกว่า 70 ภาษา ทำให้รองรับการใช้งานในสถานการณ์จริงได้กว้างขึ้น ไม่ว่าจะเป็นการเดินทาง ประชุมข้ามประเทศ เรียนออนไลน์ หรือพูดคุยกับคนต่างภาษาเมื่อเทียบกับระบบเดิมที่รองรับภาษาน้อยกว่า การรองรับมากกว่า 70 ภาษาถือเป็นก้าวสำคัญ โดยเฉพาะใน Google Meet ที่จะช่วยปลดล็อกการประชุมหลายภาษาได้มากขึ้นสำหรับใครอยากลองใช้ตอนนี้ Gemini 3.5 Live Translate เริ่มปล่อยให้ใช้งานผ่านแอป Google Translate บน Android และ iOS แล้ว โดยผู้ใช้สามารถแตะปุ่ม Live translate ที่มุมซ้ายล่างของแอปเพื่อเริ่มใช้งานเงื่อนไขสำคัญคือ Google ระบุว่าฟีเจอร์นี้ออกแบบมาให้ใช้งานร่วมกับหูฟัง เพื่อให้ผู้ใช้ฟังเสียงแปลได้ชัดเจนและเป็นส่วนตัวมากขึ้นแต่ว่าสำหรับผู้ใช้ Android แอป Google Translate กำลังทยอยเพิ่มโหมดใหม่ชื่อ Listening Mode ซึ่งช่วยให้ฟังคำแปลผ่านลำโพงสนทนาของโทรศัพท์ได้โดยตรง รูปแบบการใช้งานคล้ายการคุยโทรศัพท์ทั่วไป ผู้ใช้สามารถยกมือถือแนบหูเพื่อฟังคำแปลได้ทันที เหมาะกับสถานการณ์ที่ไม่มีหูฟังติดตัว หรือไม่สะดวกเปิดเสียงออกลำโพงภายนอกขยายไปยัง Google Meetนอกจาก Google Translate แล้ว Gemini 3.5 Live Translate ยังเตรียมขยายสู่ Google Meet ด้วย โดยจะช่วยให้การประชุมวิดีโอคอลข้ามภาษาทำได้ง่ายขึ้น เดิมทีฟีเจอร์ Speech Translation ใน Google Meet รองรับเพียง 5 ภาษา แต่เมื่อใช้ Gemini 3.5 Live Translate จะรองรับมากกว่า 70 ภาษา และเปิดทางให้เกิดชุดภาษาที่ใช้ร่วมกันได้มากกว่า 2,000 รูปแบบ ภายในการประชุมเดียวจุดที่น่าสนใจคือ Google Meet จะไม่จำกัดการแปลแบบเข้า-ออกภาษาอังกฤษเท่านั้นเหมือนเดิม แต่สามารถรองรับการแปลระหว่างภาษาต่าง ๆ ได้หลากหลายขึ้นตัวอย่างเช่น ผู้พูดภาษาญี่ปุ่นอาจสื่อสารกับผู้ฟังภาษาไทยหรือฝรั่งเศสได้สะดวกขึ้น หากระบบรองรับคู่ภาษานั้นในช่วงเปิดให้ใช้งานจริง ซึ่งช่วยให้การประชุมระดับนานาชาติมีความยืดหยุ่นมากกว่าเดิมที่สำคัญสำหรับ Google Meet ฟีเจอร์ Gemini 3.5 Live Translate จะเริ่มเปิดใช้งานแบบ Private Preview ในเดือนนี้ สำหรับลูกค้า Google Workspace บางกลุ่มที่ได้รับเลือกก่อน Google ระบุว่าจะมีการขยายการใช้งานในวงกว้างมากขึ้นภายในช่วงปลายปีนี้ ซึ่งหมายความว่าผู้ใช้ทั่วไปหรือองค์กรจำนวนมากอาจต้องรออีกสักระยะก่อนใช้งานจริงนอกจากการใช้งานผ่าน Google Translate และ Google Meet แล้ว Gemini 3.5 Live Translate ยังเปิดให้ใช้งานแบบ Public Preview สำหรับนักพัฒนาผ่าน Gemini Live API และ Google AI Studio ส่วนนี้น่าสนใจสำหรับนักพัฒนาแอปหรือบริการที่ต้องการใส่ความสามารถแปลเสียงสดเข้าไปในผลิตภัณฑ์ของตัวเอง เช่น แอปประชุม แอปเรียนภาษา ระบบคอลเซ็นเตอร์ หรือบริการท่องเที่ยวด้านความปลอดภัย Google ระบุว่าเสียงที่สร้างจาก Gemini 3.5 Live Translate จะถูกฝังลายน้ำด้วย SynthID ซึ่งเป็นลายน้ำที่มองไม่เห็นและตรวจจับได้ในเสียงที่ AI สร้างขึ้นแนวทางนี้มีเป้าหมายเพื่อช่วยให้สามารถตรวจสอบได้ว่าเสียงใดถูกสร้างโดย AI ลดความเสี่ยงด้านข้อมูลเท็จหรือการนำเสียง AI ไปใช้งานในทางที่ผิดดังนั้นแล้วGemini 3.5 Live Translate เป็นก้าวใหม่ของ Google ในการแปลเสียงพูดสด โดยเริ่มใช้งานกับ Google Translate บน Android และ iOS แล้ว พร้อมเตรียมขยายสู่ Google Meet สำหรับลูกค้า Google Workspace บางกลุ่มในรูปแบบ Private Previewจุดเด่นคือรองรับมากกว่า 70 ภาษา แปลแบบต่อเนื่อง ลื่นไหลขึ้น และเสียงที่สร้างด้วย AI จะถูกฝังลายน้ำ SynthID เพื่อช่วยลดความเสี่ยงด้านการใช้งานผิดวัตถุประสงค์ ก็ลองคิดให้ดีก่อนใช้นะ
Gemini 3.5 Live Translate มาแล้ว แปลเสียงพูดสดลื่นขึ้น รองรับ Google Translate และ Google Meet
by
Tags: