ซิดนีย์:12/24 22:26:56

โตเกียว:12/24 22:26:56

ฮ่องกง:12/24 22:26:56

สิงคโปร์:12/24 22:26:56

ดูไบ:12/24 22:26:56

ลอนดอน:12/24 22:26:56

นิวยอร์ก:12/24 22:26:56

สด  >  รายละเอียดข่าวสด

2025-09-19 09:17:19

[Xiaomi โอเพนซอร์สโมเดลเสียงพูดแบบ end-to-end ดั้งเดิมตัวแรก] เมื่อวันที่ 19 กันยายน Xiaomi ได้โอเพนซอร์สโมเดลเสียงพูดแบบ end-to-end ดั้งเดิมตัวแรกอย่างเป็นทางการ นั่นคือ Xiaomi-MiMo-Audio ซึ่งใช้สถาปัตยกรรม pre-training ที่เป็นนวัตกรรมและข้อมูลการเทรนนิ่งหลายร้อยล้านชั่วโมง ทำให้สามารถสรุปผลการทดสอบเสียงพูดแบบ few-sample generalization บนพื้นฐานของ ICL ได้เป็นครั้งแรก และสังเกตเห็นพฤติกรรม "การเกิดขึ้น" ที่ชัดเจนใน pre-training มีรายงานว่าในเกณฑ์มาตรฐานการประเมินหลายรายการ เช่น ความเข้าใจเสียงพูดทั่วไปและบทสนทนา MiMo-Audio มีประสิทธิภาพเหนือกว่าโมเดลโอเพนซอร์สอย่างมีนัยสำคัญด้วยจำนวนพารามิเตอร์ที่เท่ากัน โดยมีประสิทธิภาพสูงสุดที่ 7B ในชุดทดสอบมาตรฐานของเกณฑ์มาตรฐานความเข้าใจเสียง MMAU MiMo-Audio เหนือกว่าโมเดลเสียงพูดแบบปิดของ Google Gemini-2.5-Flash และใน Big Bench Audio S2T ซึ่งเป็นเกณฑ์มาตรฐานสำหรับการใช้เหตุผลเสียงที่ซับซ้อน MiMo-Audio ยังเหนือกว่าโมเดลเสียงพูดแบบปิดของ OpenAI GPT-4o-Audio-Preview

ข้อมูลราคาสินค้าแบบเรียลไทม์

ประเภท ราคาปัจจุบัน การเปลี่ยนแปลง

XAU

3659.00

14.73

(0.40%)

XAG

42.334

0.541

(1.29%)

CONC

63.12

-0.14

(-0.22%)

OILC

67.32

-0.14

(-0.21%)

USD

97.275

-0.081

(-0.08%)

EURUSD

1.1787

0.0002

(0.02%)

GBPUSD

1.3557

0.0003

(0.02%)

USDCNH

7.1081

0.0015

(0.02%)

ข่าวแนะนำ