Qwen

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש
Qwen
通义千问
הלוגו של Qwen 2.5, מודל השפה הפופולרי ביותר ברשימת המודלים של Qwen
הלוגו של Qwen 2.5, מודל השפה הפופולרי ביותר ברשימת המודלים של Qwen
מפתח Alibaba Cloud
מחזור חיים אפריל 2023 – הווה (כשנתיים)
גרסה אחרונה 2.5-Max (28 בינואר 2025)
מערכת הפעלה יישום רשת (Web), אנדרואיד, iOS
נכתבה בשפות פייתון
סוג רישיון אפאצ'י 2.0
קוד מקור פתוח חלקית
chat.qwen.ai

Qwenסינית מפושטת: 通义千问; טונגי קיאנוון) הוא מודל שפה גדול (LLM) אשר פותח על ידי חברת Alibaba Cloud, חברה בת של קבוצת עליבאבא העוסקת במחשוב ענן. נכון ליולי 2024, Qwen דורג בתור מודל השפה השלישי עם הביצועים הטובים ביותר, אחרי אנת'רופיק ו-OpenAI.[1]

מודלים

אליביבא הוציאה את המודל הראשון של Qwen באפריל 2023 תחת השם "טונגי קיאנוון". המודל היה.[2] המודל יצא לאור באופן רשמי בספטמבר 2023 לאחר אישורה של הממשלה הסינית.[3] בדצמבר 2023, אליבאבא הוציאו את המודלים 72B ו-1.8B תחת קוד פתוח.[4]

ביוני 2024, אליבאבא הוציאו את המודל Qwen 2 ובספטמבר הם שחררו את חלק מהמודלים שלהם בקוד פתוח, אך המודלים האיכותיים של החברה לא שוחררו בקוד פתוח.[5][6]

בנובמבר 2024, אליבאבא הוציאו את המודל QwQ-32B-Preview, אשר ניסה לחקות את פונקציית ההנמקה (reasoning) של OpenAI o1. המודל יצא תחת רישיון אפאצ'י 2.0 בגרסה חלקית.[7] במספר תחומים, המודל QwQ-32B-Preview הראה ביצועים טובים יותר מהמתחרה, OpenAI o1.[8]

ה-Qwen-VI הוא המודל הוויזואלי של Qwen, והוא משלב Vision transformer, טרנספורמר המיועד למשימות עיבוד ראייה כגון זיהוי תמונה. המודל Qwen-VL2 מחזיק ב-2 עד 7 מיליארד פרמטרים.[9]

בינואר 2025, אליבאבא הוציאו את המודל Qwen 2.5-Max, שעל פי פוסט של החברה, בעל ביצועים טובים יותר מאשר מתחרים כגון GPT-4o, DeepSeek-V3 ו-Llama-3.1-405B, באמות מידה (benchmarks) עיקריות.[10][11]

הערות שוליים

  1. Alibaba’s open-source AI model tops Chinese rivals, ranks 3rd globally, South China Morning Post, ‏2024-07-11 (באנגלית)
  2. Bai, Jinze; Bai, Shuai; Chu, Yunfei; Cui, Zeyu; Dang, Kai; Deng, Xiaodong; Fan, Yang; Ge, Wenbin; Han, Yu (2023-09-28), Qwen Technical Report, doi:10.48550/arXiv.2309.16609, נבדק ב-2025-03-04
  3. Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI, South China Morning Post, ‏2023-09-13 (באנגלית)
  4. 陈柳兵, Alibaba unveils new Tongyi Qianwen AI language model, global.chinadaily.com.cn
  5. Alibaba says new AI model Qwen2 bests Meta’s Llama 3 in tasks like maths and coding, South China Morning Post, ‏2024-06-07 (באנגלית)
  6. Arjun Kharpal, China's Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool, CNBC, ‏2024-09-19 (באנגלית)
  7. Ben Dickson, Alibaba releases Qwen with Questions, an open reasoning model that beats o1-preview, VentureBeat, ‏2024-11-29 (באנגלית אמריקאית)
  8. Kyle Wiggers, Alibaba releases an 'open' challenger to OpenAI's o1 reasoning model, TechCrunch, ‏2024-11-27 (באנגלית אמריקאית)
  9. Wang, Peng; Bai, Shuai; Tan, Sinan; Wang, Shijie; Fan, Zhihao; Bai, Jinze; Chen, Keqin; Liu, Xuejing; Wang, Jialin (2024-10-03), Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution, doi:10.48550/arXiv.2409.12191, נבדק ב-2025-03-04
  10. Qwen Team, Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model, Qwen, ‏2025-01-28 (באנגלית)
  11. אדוארדו בפטיסטה, Alibaba releases AI model it says surpasses DeepSeek, רויטרס
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

Qwen40645938Q130234299