اخبار

كوز الصنوبر يقود “انفجار” في قواعد بيانات المتجهات للذكاء الاصطناعي التوليدي


توجه إلى مكتبتنا عند الطلب لعرض الجلسات من VB Transform 2023. سجل هنا


قواعد بيانات المتجهات ، وهي نوع جديد نسبيًا من قواعد البيانات التي يمكنها تخزين البيانات غير المهيكلة والاستعلام عنها مثل الصور والنصوص والفيديو ، تكتسب شعبية بين المطورين والشركات الذين يرغبون في إنشاء تطبيقات الذكاء الاصطناعي التوليدية مثل روبوتات الدردشة وأنظمة التوصية وإنشاء المحتوى.

تعد Pinecone إحدى الشركات الرائدة في مجال توفير تقنية قاعدة بيانات المتجهات ، وهي شركة ناشئة تأسست في عام 2019 وجمعت 138 مليون دولار وقيمتها 750 مليون دولار. قالت الشركة يوم الخميس أن لديها “أكثر من 100000 مستخدم مجاني وأكثر من 4000 عميل يدفعون” ، مما يعكس انتشارًا كبيرًا في التبني من قبل المطورين من الشركات الصغيرة وكذلك الشركات التي قال Pinecone إنها تجرب بجنون مع تطبيقات جديدة.

على النقيض من ذلك ، قالت الشركة إنه في كانون الأول (ديسمبر) كان لديها عدد أقل من الآلاف من المستخدمين المجانيين ، وأقل من 300 عميل يدفعون.

عقدت Pinecone مؤتمرًا للمستخدمين يوم الخميس في سان فرانسيسكو ، حيث عرضت بعض قصص نجاحها وأعلنت عن شراكة مع Microsoft Azure لتسريع تطبيقات الذكاء الاصطناعي التوليدية لعملاء Azure.

حدث

VB Transform 2023 حسب الطلب

هل فاتتك جلسة من VB Transform 2023؟ سجل للوصول إلى المكتبة عند الطلب لجميع جلساتنا المميزة.

سجل الان

>> اتبع جميع تغطية VentureBeat Transform 2023 الخاصة بنا <<

قال بوب وايدرهولد ، الرئيس والمدير التنفيذي للعمليات في Pinecone ، في حديثه الرئيسي في VB Transform ، إن الذكاء الاصطناعي التوليدي هو منصة جديدة طغت على منصة الإنترنت وأن قواعد بيانات المتجه هي جزء أساسي من الحل لتمكينها. وقال إن منصة الذكاء الاصطناعي التوليدية ستكون أكبر من الإنترنت ، و “سيكون لها نفس التأثيرات وربما أكبر على العالم”.

قواعد بيانات المتجهات: نوع متميز من قواعد البيانات لعصر الذكاء الاصطناعي التوليدي

أوضح Widerhold أن قواعد بيانات المتجه تسمح للمطورين بالوصول إلى معلومات خاصة بالمجال غير متوفرة على الإنترنت أو في قواعد البيانات التقليدية ، وتحديثها في الوقت الفعلي. بهذه الطريقة ، يمكنهم توفير سياق ودقة أفضل لنماذج الذكاء الاصطناعي التوليدية مثل ChatGPT أو GPT-4 ، والتي يتم تدريبها غالبًا على بيانات قديمة أو غير مكتملة مأخوذة من الويب.

تسمح لك قواعد بيانات المتجه بالقيام بالبحث الدلالي ، وهي طريقة لتحويل أي نوع من البيانات إلى متجهات تتيح لك إجراء بحث عن “الجار الأقرب”. يمكنك استخدام هذه المعلومات لإثراء نافذة سياق المطالبات. وبهذه الطريقة ، “سيكون لديك عدد أقل من الهلوسة ، وستسمح لتقنيات روبوت الدردشة الرائعة هذه بالإجابة على أسئلتك بشكل صحيح ، وفي كثير من الأحيان ،” قال Wiederholt.

جاءت تصريحات Wiederhold بعد أن تحدث يوم الأربعاء في VB Transform ، حيث أوضح للمديرين التنفيذيين للشركات كيف أن الذكاء الاصطناعي التوليدي يغير طبيعة قاعدة البيانات ، ولماذا ظهر ما لا يقل عن 30 منافسًا لقاعدة بيانات المتجهات لخدمة السوق. انظر مقابلته أدناه.

بوب ويدرهولد ، مدير العمليات في Pinecone ، إلى اليمين ، يتحدث مع المستثمر تيم تولي من Menlo Ventures في VB Transform يوم الأربعاء

قال Widerhold أن نماذج اللغات الكبيرة (LLMs) وقواعد بيانات المتجهات هما تقنيتان رئيسيتان للذكاء الاصطناعي التوليدي.

وقال إنه كلما ظهرت أنواع بيانات وأنماط وصول جديدة ، بافتراض أن السوق كبير بما يكفي ، فإن مجموعة فرعية جديدة من سوق قاعدة البيانات تتشكل. وقال إن ذلك حدث مع قواعد البيانات العلائقية وقواعد البيانات التي لا تحتوي على SQL ، وهذا يحدث مع قواعد بيانات المتجهات. المتجهات هي طريقة مختلفة تمامًا لتمثيل البيانات ، والبحث عن الجيران الأقرب طريقة مختلفة تمامًا للوصول إلى البيانات ، على حد قوله.

وأوضح أن قواعد بيانات المتجه لديها طريقة أكثر فاعلية لتقسيم البيانات بناءً على هذا النموذج الجديد ، وبالتالي فهي تملأ فراغًا لا تستطيع قواعد البيانات الأخرى ، مثل قواعد البيانات العلائقية وقواعد البيانات التي لا تحتوي على SQL ، ملؤه.

وأضاف أن Pinecone قامت ببناء تقنيتها من الصفر ، دون المساومة على الأداء أو قابلية التوسع أو التكلفة. وقال إنه فقط من خلال البناء من الصفر ، يمكنك الحصول على أقل زمن انتقال وأعلى سرعات استيعاب وأقل تكلفة لتنفيذ حالات الاستخدام.

وقال أيضًا إن موفري قواعد البيانات الفائزين سيكونون هم الذين قاموا ببناء أفضل الخدمات المدارة للسحابة ، وقد قدم Pinecone هناك أيضًا.

ومع ذلك ، أقر Wiederhold أيضًا يوم الخميس بأن سوق الذكاء الاصطناعي التوليدي يمر بدورة ضجيج وأنه سيصل قريبًا إلى “حوض من الواقع” مع انتقال المطورين من تطبيقات النماذج الأولية التي ليس لديها القدرة على الدخول في الإنتاج. وقال إن هذا أمر جيد للصناعة لأنه سيفصل التطبيقات المؤثرة الجاهزة للإنتاج عن “زغب” التطبيقات النموذجية التي تشكل حاليًا غالبية التجارب.

علامات التهدئة للذكاء الاصطناعي التوليدي ، والتوقعات لقواعد بيانات المتجهات

قال إن علامات التناقص التدريجي تشمل انخفاضًا في يونيو في العدد المبلغ عنه لمستخدمي ChatGPT ، وكذلك اتجاهات تبني المستخدم الخاصة بـ Pinecone ، والتي أظهرت توقفًا في التقاط “مذهل” من ديسمبر إلى أبريل. قال: “في مايو ويونيو ، استقر الأمر على شيء أكثر منطقية”.

أجاب Wiederhold على الأسئلة في VB Transform حول حجم السوق لقواعد بيانات المتجه. قال إنها سوق كبيرة جدًا أو حتى هائلة ، لكن لا يزال من غير الواضح ما إذا كانت ستكون سوقًا بقيمة 10 مليارات دولار أم سوق بقيمة 100 مليار دولار. قال إنه سيتم حل هذا السؤال حيث يتم العمل على أفضل الممارسات خلال العامين أو الثلاثة أعوام القادمة.

قال إن هناك الكثير من التجارب التي تجري بطرق مختلفة لاستخدام تقنيات الذكاء الاصطناعي التوليدية ، وقد نشأ سؤال واحد كبير من الاتجاه نحو نوافذ سياق أكبر لمطالبات LLM. إذا تمكن المطورون من لصق المزيد من بياناتهم ، وربما حتى قاعدة البيانات بأكملها ، مباشرة في نافذة السياق ، فلن تكون هناك حاجة إلى قاعدة بيانات متجه للبحث في البيانات.

لكنه قال إن ذلك من غير المرجح أن يحدث. لقد رسم تشابهًا مع البشر الذين ، عندما يغرقون بالمعلومات ، لا يمكنهم التوصل إلى إجابات أفضل. قال إن المعلومات تكون مفيدة للغاية عندما تكون صغيرة بشكل يمكن إدارتها بحيث يمكن استيعابها. “وأعتقد أن نفس الشيء صحيح [with] نافذة السياق من حيث وضع كميات هائلة من المعلومات فيها “. واستشهد بدراسة أجرتها جامعة ستانفورد هذا الأسبوع والتي نظرت في تقنية chatbot الحالية ووجدت أن كميات أقل من المعلومات في نافذة السياق أنتجت نتائج أفضل. (طلب VentureBeat مزيدًا من المعلومات حول الدراسة ، وسيتم تحديثها بمجرد سماع رد من Pinecone).

وقال أيضًا إن بعض الشركات الكبيرة تقوم بتجربة نماذج الأساس الخاصة بها ، والبعض الآخر يقوم بضبط نماذج الأساس الحالية ، ويمكن لكل من هذين النهجين تجاوز الحاجة إلى استدعاء قواعد بيانات المتجهات. لكن كلا النهجين يتطلب الكثير من الخبرة ، وهما مكلفان. “هناك عدد محدود من الشركات التي ستكون قادرة على القيام بذلك.”

بشكل منفصل ، في Transform يوم الأربعاء ، كان هذا السؤال حول بناء النماذج أو ببساطة التحميل على قمة GPT-4 بقواعد بيانات المتجهات سؤالًا رئيسيًا للمديرين التنفيذيين على مدار يومين من الجلسات. أقر Naveen Rao ، الرئيس التنفيذي لشركة MosaicML ، التي تساعد الشركات على بناء نماذج لغوية كبيرة خاصة بها ، أن هناك عددًا محدودًا من الشركات التي لديها القدرة على دفع 200 ألف دولار لبناء النماذج ، ولكن لديها أيضًا الخبرة في مجال البيانات ، والإعداد والبنية التحتية الأخرى اللازمة للاستفادة منها. تلك النماذج. قال إن شركته لديها 50 زبونًا ، لكن يجب أن تكون انتقائية للوصول إلى هذا العدد. وقال إن هذا الرقم سيزداد خلال العامين أو الثلاثة أعوام المقبلة ، مع قيام هذه الشركات بتنظيف وتنظيم بياناتها. هذا الوعد ، جزئيًا ، هو سبب إعلان Databricks الأسبوع الماضي أنها ستستحوذ على MosaicML مقابل 1.3 مليار دولار.

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.


اكتشاف المزيد من نص كم

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من نص كم

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading