Hugging Face

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש
Hugging Face, Inc.
נתונים כלליים
סוג חברה פרטית
מייסדים קלמנט דלנג, ז'וליאן שאמון, תומס וולף
תקופת הפעילות 2016–הווה (כ־8 שנים)
מיקום המטה ניו יורק סיטי, ארצות הברית
מוצרים עיקריים Transformers, datasets, spaces, Hugging Face Hub
 
huggingface.co

Hugging Face היא חברה אמריקאית המפתחת כלים לבניית יישומים באמצעות למידת מכונה.[1] בין מוצרי הדגל של החברה בולטת ספריית הטרנספורמרים שלה שנבנתה עבור יישומי עיבוד שפה טבעית. בנוסף, לחברה פלטפורמה בשם Hugging Face Hub, המאפשרת למשתמשים לשתף מודלים ומערכי נתונים של למידת מכונה בקוד פתוח. על אף שמדובר בחברה פרטית, נכון ל-2023 אופי החברה דוגל בשיתופיות והנגשת מודלי שפה גדולים, הנחשבת לנחלתם של תאגידים טכנולוגיים, לכלל קהילת המפתחים.[2]

היסטוריה

החברה נוסדה ב-2016 על ידי היזמים הצרפתים קלמנט דלאנג, ז'וליאן שאמון ותומס וולף. מטרת החברה בעת היווסדה הייתה פיתוח אפליקציית צ'טבוט המיועדת לבני נוער. [3] לאחר שהחברה פרסמה בקוד פתוח את המודל שעמד בבסיס הצ'טבוט, החלה החברה לפנות לכיוון פיתוח פלטפורמה פתוחה למודלי למידת מכונה.

במרץ 2021 גייסה החברה 40 מיליון דולר בסבב גיוס B.[4]

ב-28 באפריל 2021, החברה השיקה את סדנת המחקר BigScience בשיתוף עם מספר קבוצות מחקר אחרות, במטרה לשחרר לקהילה מודל שפה גדול בקוד פתוח.[5] בשנת 2022 הסתיימה הסדנה בהכרזה על BLOOM, מודל שפה רב לשוני עם 176 מיליארד פרמטרים.[6]

ב-21 בדצמבר 2021, החברה הודיעה על רכישת Gradio, ספריית תוכנה המשמשת להדגמות דפדפן אינטראקטיביות של מודלים של למידת מכונה.[7]

ב-5 במאי 2022, החברה הודיעה על סבב גיוס נוסף, לפי שווי של 2 מיליארד דולר.[8]

ב-3 באוגוסט 2022, החברה הכריזה על Private Hub, גרסה פרטית עם ייעוד ארגוני של פלטפורמת המודלים הפתוחה Hugging Face Hub.[9]

בפברואר 2023, החברה הודיעה על שותפות עם Amazon Web Services ‏(AWS) שתאפשר ללקוחות AWS שימוש מותאם אישית במוצרים של Hugging Face. עוד הודיעה כי הדור הבא של מודל השפה BLOOM יופעל על Trainium, שבב למידת מכונה קנייני שנוצר על ידי AWS.[10][11]

שירותים וטכנולוגיות

ספריית Transformers

ספריית Transformers היא חבילת פייתון המכילה יישומי קוד פתוח של מודלי טרנספורמר הנועדו לבצע משימות מתחום ניתוחי הטקסט, התמונה והאודיו. הספרייה מותאמת לפרויקטים המשתמשים בספריות הלמידה העמוקה הפופולריות ביותר PyTorch, TensorFlow ו- JAX, ומוטמעים בה מודלי שפה בולטים דוגמת BERT ו- GPT-2.[12]

הספרייה מסוגלת לבצע משימות ספציפיות מתחום למידת המכונה. כך למשל, על מנת לבצע ניתוח סנטימנט (זיהוי האם הרגש הנובע מטקסט הוא חיובי או שלילי), ניתן להשתמש בספריה כך:

from transformers import pipeline
sentiment_pipeline = pipeline("sentiment-analysis")
data = ["I love you", "I hate you"]
sentiment_pipeline(data)

כאשר התוצאה במקרה זה תהיה:

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]

Hugging Face Hub

Hugging Face Hub היא פלטפורמה ( שירות אינטרנט מרכזי) לאירוח:[13]

  • מאגרי קוד מבוססי גיט, וכוללת תכונות המזכירות את גיטהאב, אך עם אוריינטציה המכוונת לתחום למידת המכונה.
  • מודלים של למידת מכונה. בפלטפורמה קיימים מודלים שנבנו על ידי משתמשים אינדיבידואלים, ועד תאגידי ענק כמו גוגל, מטא, ואף מדינות דוגמת איחוד האמירויות הערביות.[14]
  • מערכי נתונים, בעיקר בטקסט, תמונות ואודיו;
  • יישומי אינטרנט המיועדים להדגמות בקנה מידה קטן של יישומי למידת מכונה.

Hugging Chat

לחברה צ'טבוט מקוון בשם Hugging Chat,[15] המבוסס על מודל שפה גדול בקוד פתוח, אשר ניתן לשוחח עמו בדומה ל-ChatGPT. נכון ליולי 2023, הצ'טבוט מבוסס על מודל LLaMA-2 של חברת מטא.[16]

ספריות נוספות

בנוסף לשתי הספריות האמורות, Hugging Face כוללת ספריות פייתון למשימות נוספות, כגון datasets לעיבוד נתונים, Evaluate להערכת מודלים, Simulate להרצת סימולציות ועוד.[17]

הערות שוליים

  1. ^ "Hugging Face – The AI community building the future". huggingface.co. נבדק ב-2022-08-20.
  2. ^ Hugging Face takes step toward democratizing AI and ML, VentureBeat, ‏2022-09-27 (באנגלית אמריקאית)
  3. ^ "Hugging Face wants to become your artificial BFF". TechCrunch (באנגלית אמריקאית). 9 במרץ 2017. נבדק ב-2022-08-20. {{cite web}}: (עזרה)
  4. ^ "Hugging Face raises $40 million for its natural language processing library". 11 במרץ 2021. {{cite web}}: (עזרה)
  5. ^ "Inside BigScience, the quest to build a powerful open language model". 10 בינואר 2022. {{cite web}}: (עזרה)
  6. ^ "BLOOM". bigscience.huggingface.co. נבדק ב-2022-08-20.
  7. ^ "Gradio is joining Hugging Face!". huggingface.co. נבדק ב-2022-08-20.
  8. ^ Cai, Kenrick. "The $2 Billion Emoji: Hugging Face Wants To Be Launchpad For A Machine Learning Revolution". Forbes (באנגלית). נבדק ב-2022-08-20.
  9. ^ "Introducing the Private Hub: A New Way to Build With Machine Learning". huggingface.co. נבדק ב-2022-08-20.
  10. ^ Bass, Dina (2023-02-21). "Amazon's Cloud Unit Partners With Startup Hugging Face as AI Deals Heat Up". Bloomberg News.
  11. ^ Nellis, Stephen (2023-02-21). "Amazon Web Services pairs with Hugging Face to target AI developers". Reuters.
  12. ^ "🤗 Transformers". huggingface.co. נבדק ב-2022-08-20.
  13. ^ "Hugging Face Hub documentation". huggingface.co. נבדק ב-2022-08-20.
  14. ^ Barrington, Lisa (2023-05-25). "Abu Dhabi makes its Falcon 40B AI model open source". Reuters (באנגלית). נבדק ב-2023-06-03.
  15. ^ HuggingChat, huggingface.co (באנגלית)
  16. ^ Get Hands-On With Meta's New Llama 2 Chat, Maginative, ‏2023-07-18 (באנגלית)
  17. ^ "Hugging Face - Documentation". huggingface.co. נבדק ב-2023-02-18.
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

36765789Hugging Face