يجلب DataStax البحث في قاعدة بيانات المتجهات إلى الوسائط المتعددة باستخدام Astra DB

يجلب DataStax البحث في قاعدة بيانات المتجهات إلى الوسائط المتعددة باستخدام Astra DB


توجه إلى مكتبتنا عند الطلب لعرض الجلسات من VB Transform 2023. سجل هنا


يدخل بائع منصة البيانات DataStax مساحة قاعدة بيانات المتجه ، معلناً عن التوافر العام للبحث المتجه في قاعدة البيانات السحابية Astra DB الرائدة الخاصة به.

DataStax هو أحد المساهمين الرئيسيين في قاعدة بيانات Apache Cassandra مفتوحة المصدر ، حيث تعمل Astra DB كقاعدة بيانات سحابية مدعومة تجاريًا (DBaaS). Cassandra هي ما يُعرف بقاعدة بيانات NoSQL ، على الرغم من أنها توسعت في السنوات الأخيرة لدعم أنواع بيانات متعددة وحالات استخدام موسعة ، لا سيما AI / ML.

في الواقع ، دفعت DataStax نظامها الأساسي العام نحو AI / ML خلال عام 2023 ، واستحوذت على بائع هندسة ميزات الذكاء الاصطناعي Kaskada في يناير. قامت Datastax بدمج تقنية Kaskada في خدمة DataStax Luna ML الخاصة بها ، والتي تم إطلاقها في مايو.

يعمل تحديث دعم ناقل Astra DB الجديد على توسيع قدرات الذكاء الاصطناعي / التعلم الآلي الخاصة بـ DataStax ، مما يمنح المؤسسات منصة قاعدة بيانات موثوقة ومنتشرة على نطاق واسع يمكنهم استخدامها لكل من أعباء العمل التقليدية وأعباء عمل الذكاء الاصطناعي الأحدث.

حدث

VB Transform 2023 حسب الطلب

هل فاتتك جلسة من VB Transform 2023؟ سجل للوصول إلى المكتبة عند الطلب لجميع جلساتنا المميزة.

سجل الان

تمت معاينة قدرة المتجه لأول مرة على Google Cloud Platform في يونيو. مع التوافر العام ، يمكن الوصول إليه اليوم محليًا على Amazon Web Services (AWS) و Microsoft Azure أيضًا.

قال إد أنوف ، كبير مسؤولي المنتجات في DataStax ، لموقع VentureBeat: “بكل طريقة ذات مغزى ، أصبحت Astra DB الآن قاعدة بيانات متجهية أصلية مثل أي شخص آخر”.

ما هي قواعد البيانات المتجهية كلها

تعد قواعد بيانات المتجهات أساسية لعمليات الذكاء الاصطناعي / تعلم الآلة. تمكن من تخزين المحتوى كمتجه تضمين – تمثيل رقمي للبيانات.

أوضح Anuff أن المتجهات هي طريقة مثالية لتمثيل المعنى الدلالي للمحتوى ، ولها قابلية تطبيق واسعة للتطبيقات ضمن نماذج اللغة الكبيرة (LLMs) وكذلك لتحسين الصلة عند محاولة استرداد المحتوى.

هناك العديد من الأساليب والموردين المختلفين في مساحة قاعدة بيانات المتجه اليوم. يشمل البائعون المصممون لغرض معين Pinecone ، الذي تحدث رئيسه ومدير العمليات في حدث VB Transform الأخير حول “الانفجار” في قواعد بيانات المتجهات للذكاء الاصطناعي التوليدي. تعد قاعدة بيانات Milvus vector مفتوحة المصدر خيارًا شائعًا آخر. من الأساليب الشائعة بشكل متزايد لقواعد بيانات المتجه توفير بحث متجه كتراكب أو امتداد لمنصة قاعدة بيانات موجودة. أعلن MongoDB عن دعمه للبحث في المتجهات في يونيو. تدعم قاعدة بيانات PostgreSQL المنتشرة على نطاق واسع المتجهات عن طريق تقنية pgvector.

>> اتبع جميع تغطية VentureBeat Transform 2023 الخاصة بنا <<

أوضح Anuff أن بحث المتجه في DataStax يستخدم أعمدة متجه كنوع بيانات أصلي في Astra DB. باستخدام المتجهات كنوع بيانات ، يمكن لمستخدمي Astra DB الاستعلام والبحث كثيرًا كما يفعلون مع أي نوع آخر من البيانات.

كيف وسعت كاساندرا وأسترا دي بي مفهوم المتجهات

تأتي قدرات قاعدة بيانات المتجه إلى DataStax’s Astra DB قبل توفر الميزة في مشروع Cassandra مفتوح المصدر. أوضح Anuff أنه تمت إضافة الميزة إلى مشروع مفتوح المصدر ، ومع ذلك ، ستكون متاحة في إصدار Cassandra 5.0 القادم في وقت لاحق من هذا العام. بصفتك بائعًا تجاريًا ، فإن DataStax قادرة على سحب الكود إلى نظامها الأساسي في وقت سابق ، وهذا هو السبب في أن Astra DB تحصل على الميزة الآن.

أوضح أنوف أن جوهر بنية كاساندرا هو فكرة أنواع البيانات القابلة للتوسعة. على هذا النحو ، يمكن لقاعدة البيانات بمرور الوقت دمج أنواع بيانات أصلية إضافية. كنوع بيانات أصلي ، يتم دمج المتجهات أو أي بيانات أخرى لهذه المسألة مع نظام الفهرس الموزع الخاص بـ Cassandra.

قال أنوف: “ما يعنيه ذلك هو أنه يمكنني الاستمرار في إضافة صفوف إلى قاعدة البيانات الخاصة بي إلى الأبد ، حتى يكون لدي 100 مليون متجه ، ويمكنني الحصول على تريليون متجه”. “لذا إذا كنت أرغب في الحصول على مجموعة بيانات كبيرة بها متجه لكل إدخال فيها ، فلن أشعر بالقلق من عدد الصفوف الموجهة التي أضعها. هذا بالضبط ما تفعله كاساندرا ، إنه ليس تراكبًا ، إنه جزء أصلي من النظام “.

يعد تكامل LangChain الأصلي مكافأة

من الأساليب الشائعة بشكل متزايد لبناء تطبيقات مدعومة بالذكاء الاصطناعي استخدام LLMs معًا. يتم تمكين هذا النهج بشكل شائع باستخدام تقنية LangChain مفتوحة المصدر التي تدعمها الآن DataStax’s Astra DB.

يسمح التكامل بإدخال نتائج بحث متجه Astra DB في نماذج LangChain لتوليد استجابات. هذا يسهل على المطورين بناء وكلاء في الوقت الفعلي لا يمكنهم فقط إجراء تنبؤ ولكن في الواقع تقديم توصية باستخدام نتائج بحث متجه من Astra DB ونماذج LangChain المرتبطة.

شدد Anuff على أن امتلاك قدرات المتجهات المتاحة بشكل عام على النظام الأساسي يعد خطوة كبيرة نحو جعل الذكاء الاصطناعي التوليدي حقيقة واقعة لمستخدمي المؤسسات.

>> تابع تغطية الذكاء الاصطناعي التوليدية المستمرة من VentureBeat <<

“الدخول في [generative AI] إنها خطوة كبيرة ، لأن لدينا الكثير من العملاء الذين يدخلون ويقولون ، انظر ، هل يمكننا إنشاء ذكاء اصطناعي في الإنتاج هذا العام؟ ” قال عنوف. “الجواب هو: نحن مستعدون للذهاب إذا كنت كذلك ، لذلك نحن متحمسون جدًا لذلك.”

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.

Comments

No comments yet. Why don’t you start the discussion?

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *