สะเทือนวงการ AI ! Google เปิดตัว Gemini เก่งกว่า GPT-4 แทบทุกด้าน

07 ธ.ค. 2023

12:03 น

Tech

สะเทือนวงการ AI ! Google เปิดตัว Gemini เก่งกว่า GPT-4 แทบทุกด้าน

สรุปข่าว

นับตั้งแต่แชทจีพีที (ChatGPT) ของบริษัทโอเพนเอไอ (OpenAI) เปิดตัวเมื่อเดือนพฤศจิกายน 2021 มันก็ได้จุดกระแสปัญญาประดิษฐ์ (AI) ให้กลายเป็นที่สนใจของคนทั่วโลกอีกครั้ง รวมถึงเป็นหนึ่งใน AI ที่ทรงพลังที่สุดในโลก แต่มุมมองในภาคส่วนนี้อาจกำลังจะเปลี่ยนไป เมื่อล่าสุดกูเกิล (Google) ได้เปิดตัวโมเดล AI ใหม่ล่าสุดชื่อเจมิไน (Gemini) ที่กูเกิลอ้างว่าเก่งกว่าโมเดล GPT-4 ของ OpenAI แทบทุกด้านในการทดสอบ และ ซุนดาร์ พิชัย (Sundar Pichai) ซีอีโอของกูเกิลก็บอกว่า “นี่นับเป็นยุคสมัยใหม่ของ AI” เลยทีเดียว

Gemini คือโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ล่าสุดของกูเกิลและถือเป็นก้าวกระโดดครั้งสำคัญของอุตสาหกรรม AI มันจะถูกนำมาใช้ในผลิตภัณฑ์ทั้งหมดของกูเกิลโดยแบ่งออกเป็น 3 ขนาดด้วยกัน เริ่มจากขนาดเล็กที่สุดคือเจมิไนนาโน (Gemini Nano) ซึ่งออกแบบมาให้ใช้งานทั่วไป และใช้งานบนสมาร์ตโฟนได้ ถัดมาคือเจมิไนโปร (Gemini Pro) ซึ่งจะถูกนำมาใช้ขับเคลื่อนบริการ AI ต่าง ๆ ของกูเกิลและตอนนี้มันเข้าไปทำงานอยู่เบื้องหลังแชทบอตอย่างบาร์ด (Bard) ของกูเกิลแล้วด้วย ส่วนขนาดที่ใหญ่ที่สุดคือเจมิไนอัลตรา (Gemini Ultra) ซึ่งเป็น LLM ที่ทรงพลังที่สุดที่กูเกิลเคยสร้างมา มันถูกออกแบบมาให้ใช้งานในศูนย์ข้อมูลขนาดใหญ่ในระดับองค์กรที่มีการทำงานซับซ้อน เพื่อการศึกษาและพัฒนาในระดับที่ใหญ่ขึ้น ซึ่ง Gemini Ultra นี้เอง ที่มันสามารถเอาชนะโมเดลภาษา GPT-4 ของ OpenAI ได้เกือบทุกด้านในการทดสอบ

สะเทือนวงการ AI ! Google เปิดตัว Gemini เก่งกว่า GPT-4 แทบทุกด้าน

ตอนนี้ Gemini Pro เข้าไปทำงานเบื้องหลัง Bard เรียบร้อยแล้ว ส่วนสมาร์ตโฟนพิกเซล-8 โปร (Pixel 8 Pro) ซึ่งเป็นสมาร์ตโฟนของกูเกิล ผู้ใช้ก็จะเห็นฟีเจอร์ใหม่ ๆ เพิ่มขึ้นมา ซึ่งเป็นความสามารถของ Gemini Nano ส่วน Gemini Ultra จะเปิดให้บริการปีหน้า

ลูกค้าระดับองค์กรและนักพัฒนาสามารถใช้งาน Gemini Pro ได้ในวันที่ 13 ธันวาคม ผ่าน Google Generative AI Studio หรือ Vertex AI ใน Google Cloud แต่ตอนนี้ยังรองรับแค่ภาษาอังกฤษเท่านั้น แต่ภาษาอื่น ๆ ก็จะตามมาเร็ว ๆ นี้ ด้านซุนดาร์ พิชัยก็บอกว่าหลังจากนี้ความสามารถของ AI นี้ก็จะเข้าไปทำงานเบื้องหลังผลิตภัณฑ์อื่น ๆ ของกูเกิล ไม่ว่าจะเป็นเสิร์ชเอนจิ้น Google ที่พวกเราใช้กันอยู่บ่อย ๆ หรือเว็บบราวเซอร์อย่างโคร์ม (Chrome) ฯลฯ

ในเรื่องของการทดสอบนั้น ได้นำ Gemini ไปทดสอบประสิทธิภาพ 32 ข้อ (Benchmarks) เปรียบเทียบกับ GPT-4 ตั้งแต่การวัดประสิทธิภาพการเข้าใจภาษาแบบมัลติทาสก์ ไปจนถึงการทดสอบความสามารถในการสร้างโค้ดไพทอน (Python) และผลลัพธ์ก็คือ Gemini มีประสิทธิภาพเหนือกว่าถึง 30 ข้อเลยทีเดียว จุดเด่นมากของ Gemini คือมีความสามารถในการให้เหตุผลที่ซับซ้อนมากขึ้น และทำความเข้าใจข้อมูล จะเห็นได้จากการทดสอบว่าสามารถโต้ตอบกับวิดีโอและเสียงได้อย่างเป็นธรรมชาติ

ตอนนี้โมเดลพื้นฐานของ Gemini เป็นการกรอกข้อความเข้าไปในให้ AI ประมวลผล และตอบกลับในรูปแบบข้อความเช่นกัน แต่ Gemini Ultra จะสามารถทำงานได้ทั้งรูปภาพ วิดีโอ และเสียง “และมันก็จะขยายขอบเขตไปมากกว่านั้นอีก” ตามคำบอกเล่าของ เดมิส ฮาสซาบิส (Demis Hassabis) ซีอีโอของกูเกิล ดีปไมด์ (Google DeepMind) ทั้งยังบอกเพิ่มเติมว่าในอนาคต Gemini จะพัฒนาขึ้น เช่น มีประสาทสัมผัสมากขึ้น มีสติมากขึ้น และมีความแม่นยำมากขึ้น “เหมือนหุ่นยนต์มากกว่า”

นี่ถือเป็นการแข่งขันของกูเกิลในฐานะองค์กรที่เน้นการพัฒนาด้าน AI (AI First) แต่ถูก ChatGPT แย่งชิงความโดดเด่นไปนานพอสมควร แต่ทั้งนี้นับว่าเป็นความก้าวหน้าของวงการ AI และด้านเทคโนโลยีของโลก ที่จะมีนวัตกรรมใหม่ ๆ เข้ามาผลักดันโลกให้ก้าวหน้ามากยิ่งขึ้น