🗨️Typhoon; โมเดล AI สัญชาติไทย รองรับ ‘เลขไทย’ เอกสาร ‘ราชการ’ ก็ไม่กลัว ดึงข้อมูลจาก-PDF OCR โปรเจคภายใต้ยานแม่ SCB-X
[เปิดให้นักพัฒนา AI ทั่วโลกสามารถใช้งานได้แล้ววันนี้ “ไต้ฝุ่น” โมเดลภาษาไทยขนาดใหญ่บน Samba-1] กลุ่ม SCBX นำโดย เอสซีบี เอกซ์ (SCBX) และเอสซีบี เท็นเอกซ์ (SCB 10X) เดินหน้าผลักดันระบบนิเวศและคอมมูนิตี้ AI ในประเทศไทยอย่างต่อเนื่องเพื่อตอกย้ำความมุ่งมั่นของกลุ่ม SCBX ในการเป็นองค์กรที่ขับเคลื่อนด้วย AI หรือ AI-First Organization ล่าสุด ผนึกกำลัง SambaNova Systems บริษัทผู้ให้บริการโซลูชันด้าน Generative AI ที่รวบรวมโมเดลที่เร็วที่สุด และ Chips ที่ทันสมัยที่สุด นำ “ไต้ฝุ่น” (Typhoon) โมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) เปิดให้บริการบนแพลตฟอร์ม Samba-1 Composition of Experts (CoE) เพื่อให้นักพัฒนา AI ทั่วโลกสามารถใช้ต่อยอดและพัฒนาแอปพลิเคชันด้าน AI บนแพลตฟอร์ม Samba-1 ได้แล้ววันนี้ “ไต้ฝุ่น” (Typhoon) โมเดลภาษาขนาดใหญ่ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ (Large Language Model optimized for Thai) ซึ่งนับเป็นโมเดลภาษาไทยขนาดใหญ่ที่ดีที่สุดในปัจจุบันและมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 และ GPT-4 ในภาษาไทย โดยวัดจาก Benchmark ที่รวบรวมและจัดเตรียมมาจากข้อสอบภาษาไทยความยากเทียบเท่าข้อสอบมัธยมปลายและข้อสอบมาตรฐานอื่นๆ ในประเทศไทย โดย “ไต้ฝุ่น” (Typhoon) ถูกออกแบบมาเพื่อแก้ไขปัญหาช่องว่างทางภาษาที่โมเดลส่วนใหญ่ในปัจจุบันถูกฝึกฝนเป็นภาษาอังกฤษเป็นหลัก รวมถึงข้อจำกัดด้านทรัพยากรของภาษาไทยที่ไม่มีข้อมูลมากเพียงพอ (Low Resource Language) ผู้สนใจและนักพัฒนาทดลองสามารถดาวน์โหลด Typhoon Model เพื่อต่อยอดในการพัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI ได้ฟรีตั้งแต่วันนี้ ศึกษาข้อมูลเพิ่มเติม ได้ที่ https://opentyphoon.ai/ [ทำไมไทยต้องมี AI ที่มี LLM เป็นของตนเอง?] . ประหยัดต้นทุนต่อ Token: ในเชิงเทคนิค หากใครจ่ายเงินใช้ AI อย่าง ChatGPT, Gemini หรือ แบรนด์ใดๆ อยู่จะทราบว่าการใช้งานของคุณ จำกัด token ตามแพ็คเกจที่จ่ายเงิน สมมติเช่น Hi = 1 คำ 2 token, แต่พอเป็น สวัสดี อาจจะใช้มากถึง 4-5 token เพื่อให้ Ai เข้าใจคำที่มีความหมายเดียวกันในต่างภาษา เพราะ LM หรือ […]