Google I/O 2024 เปิดตัว Project Astra ที่มาแข่งกับ GPT-4o ของ OpenAI และบริการอื่น ๆ จาก Gemini
Google จัดงาน Google I/O 2024 เปิดตัว Project Astra ที่มาแข่งกับ GPT-4o ของ OpenAI และบริการอื่น ๆ จาก Gemini
ในงานประชุมนักพัฒนา Google I/O 2024 ได้เปิดตัว Gemini 1.5 Flash ที่มีพื้นฐานจาก Gemini 1.5 Pro แต่เน้นความคล่องตัวในด้านการประมวลผลมากขึ้น พร้อมนำไปพัฒนาโครงการแอสตรา (Project Astra) ที่สื่อตั้งข้อสังเกตว่าการใช้งานในลักษณะเดียวกันกับ GPT-4o ของ OpenAI
ความสามารถ Google Gemini ใน Project Astra
ในคลิปการสาธิตได้แสดงให้เห็นว่า Gemini สามารถอ่านข้อมูลจากภาพวิดีโอ ตอบกลับด้วยเสียงแบบทันที รวมถึงสามารถขัดจังหวะการตอบของ Gemini ได้ และอ่านข้อความที่เป็นโค้ดโปรแกรมจากกล้องสมาร์ตโฟนและแปลความหมายได้ทันที
อย่างไรก็ตาม The Verge สื่อด้านเทคโนโลยีชื่อดัง ตั้งข้อสังเกตว่าการสาธิตของ Google ไม่ได้เป็นแบบ Live Demo เหมือนกับ OpenAI เมื่อวันที่ 14 พฤษภาคมที่ผ่านมา
การเปิดตัวความสามารถอื่น ๆ ของ Google Gemini
นอกจาก Project Astra แล้ว บริษัทยังได้พัฒนาบริการใหม่ ๆ ภายใต้โมเดล AI Gemini 1.5 Pro ดังนี้
1. AI Overviews ระบบการค้นหาที่เป็นระบบและลึกมากขึ้นด้วย AI ที่ Google เรียกว่า Search Generative Experiences หรือคำถามในรูปแบบที่มีความซับซ้อนและมีปฏิสัมพันธ์มากขึ้น เช่น การถามทริปท่องเที่ยว การช่วยวางแผนออกกำลังกาย โดย AI Overviews จะเริ่มให้บริการในสหรัฐอเมริกาเป็นเขตแรก และทยอยให้บริการในประเทศอื่น ๆ ต่อไป
2. Google Photo เปิดตัวฟีเชอร์ Ask Photos ที่นำเอา Gemini มาช่วยค้นหารูปภาพในแบบที่เจาะจงมากขึ้น เช่น การใช้ Ask Photos ค้นหาเลขป้ายทะเบียนรถยนต์ที่เคยถ่ายไว้ หรือแสดงภาพการฝึกว่ายน้ำของลูกสาวที่เคยถ่ายเอาไว้ทั้งหมด
3. Google Workspace เปิดตัวฟีเชอร์สรุปอีเมลจำนวนมากออกมาเป็นรายการสิ่งที่ต้องทำ (Task) ใน Gmail และสรุปใจความสำคัญจากการประชุมผ่าน Google Meet
4. Google Agents ระบุว่า หากเราซื้อรองเท้าผิดคู่ ผิดไซส์ AI Agents จะทำเรื่องคืนให้เองโดยไม่ต้องเสียเวลาไปกับขั้นตอนการคืนสินค้า
5. Google Imagen 3 ปรับปรุงการสร้างภาพ (Generate) ให้ละเอียดและสมจริงมากขึ้น พร้อมรองรับคำสั่ง (Prompt) ที่เป็นธรรมชาติในแบบที่มนุษย์เขียนมากขึ้น
6. Music AI Sandbox บน Youtube จะเข้ามาช่วยสร้างเสียงเพลงสำหรับผู้สร้างเนื้อหาบน Youtube
7. Veo บริการสร้างวิดีโอด้วยคำสั่ง (Prompt) ที่ปรับแต่งได้ โดยสร้างวิดีโอในรูปแบบภาพยนตร์ที่มีความละเอียดสูงสุด 1080p ซึ่งเชื่อว่าเปิดตัวมาเพื่อแข่งกับ Sora ของ OpenAI
8. Google Search นำ Gemini มาใช้ยกระดับการค้นหาบน Google เช่น เมื่อค้นหาคำว่า "สตูดิโอพิลาทิส" นอกจากจะขึ้นข้อมูลตำแหน่งสถานที่ที่ตรงกับการค้นหาแล้ว ยังค้นหาสตูดิโอที่เปิดสอน และช่วงเวลาที่เปิดสอน รวมถึงวิธีการจองคลาสเรียนในคำเดียว
ทั้งนี้ ตลอดการนำเสนองาน Google I/O ตั้งแต่เวลา 0.00 - 1.51 น. ตามเวลาประเทศไทย Google ได้ให้ผู้ร่วมงานทายจำนวนครั้งที่การนำเสนอพูดคำว่า "AI" ก่อนจะเฉลยโดยซุนดรา พิชัย (Sundra Pichai) ประธานเจ้าหน้าที่บริหารของกูเกิลเองว่าพูดคำว่า "AI" ไปทั้งหมด 121 ครั้ง แต่หลังจากสรุปแล้วก็ยังมีการเอ่ยคำว่า "AI" ด้วย
ภาพจาก Google
ข่าวแนะนำ