เปิดตัวโมเดลปัญญาประดิษฐ์ GPT-4o พูดโต้ตอบเรียลไทม์ และปรับโทนเสียงตามอารมณ์

เปิดตัวโมเดลปัญญาประดิษฐ์ AI เจนเนอเรชั่นใหม่ที่เรียกว่า GPT-4o พูดโต้ตอบเรียลไทม์ และปรับโทนเสียงตามอารมณ์

บริษัท OpenAI ผู้นำด้านเทคโนโลยีปัญญาประดิษฐ์จัดงาน Spring Update ภายในงานได้เปิดตัวโมเดลปัญญาประดิษฐ์ GPT-4o ซึ่งตัว o ถูกตั้งตามอักษรย่อของคำว่า "omnimodel"

โมเดลปัญญาประดิษฐ์ GPT-4o รองรับความสามารถในการพูดคุยโต้ตอบแบบเรียลไทม์ตามเวลาจริง แปลภาษาได้รวดเร็ว และแสดงอารมณ์ในการออกเสียงรูปแบบต่าง ๆ ได้ บริษัทเตรียมเปิดให้ผู้ใช้ทุกคนใช้งานได้ฟรี

บริษัทเปิดเผยว่าการทำงานของ GPT-4o มีความคล้ายกับ GPT-4 แต่มีการทำงานที่รวดเร็วมากกว่าประมาณ 2 เท่า รวมไปถึงความสามารถด้านเสียงเพื่อพูดคุยกับผู้ใช้งาน โดยบริษัทต้องการพัฒนาให้มีการพูดคุยเหมือนการพูดคุยกับมนุษย์จริง ๆ

ในระหว่างสาธิตการใช้งานสนทนากับ GPT-4o นอกจากความสามารถตอบสนองแทบจะในทันทีเมื่อผู้นำเสนอพูดจบ แต่ยังตอบกลับด้วยการอ่านออกเสียงข้อความอีกด้วย โดยให้ความรู้สึกเหมือนกับว่าคุณกำลังพูดคุยกับใครบางคนแบบเรียลไทม์

ความสามารถในการแนะนำข้อมูลเพิ่มเติม เล่าเรื่องราวต่าง ๆ รวมไปถึงสอนวิธีการหายใจที่มีประสิทธิภาพให้กับร่างกายผู้ทดสอบมากที่สุด รวมไปถึงการสาธิตการเล่านิทานก่อนนอน โดย GPT-4o เปลี่ยนโทนเสียงคล้ายการแสดงอารมณ์ไปมาระหว่างการสนทนาให้เร็วขึ้นหรือช้าลง

จุดเด่นอีกย่างของ GPT-4o คือ การทำหน้าที่เป็นผู้ช่วยประจำตัวผู้ใช้งานบนหน้าจอคอมพิวเตอร์ โดยสามารถช่วยอธิบายข้อความ กราฟิกต่าง ๆ หรือแม้แต่การอธิบายการทำงานของโค้ดโปรแกรมที่ยากให้กลายเป็นเรื่องง่าย

นอกจากนี้ ทีมงานได้ปรับหน้าจอ UI ของแอปพลิเคชัน ChatGPT บนคอมพิวเตอร์ให้ใช้งานได้ง่ายเพิ่มมากขึ้น รวมไปถึงการปรับปรุงโมเดลปัญญาประดิษฐ์ GTP-4o ให้รองรับภาษาต่าง ๆ ที่ดีมากขึ้นกว่า 50 ภาษา

ที่มาของข้อมูล xda-developers, Techcrunch

ข่าวฮิตติดแท็ก