يسهِّل Landing AI من Andrew Ng إنشاء تطبيقات رؤية الكمبيوتر باستخدام Visual Prompting

يسهِّل Landing AI من Andrew Ng إنشاء تطبيقات رؤية الكمبيوتر باستخدام Visual Prompting


انضم إلى كبار المديرين التنفيذيين في سان فرانسيسكو يومي 11 و 12 يوليو ، لمعرفة كيف يدمج القادة استثمارات الذكاء الاصطناعي ويحسنونها لتحقيق النجاح. يتعلم أكثر


أعلنت شركة Landing AI ، وهي شركة تقدم برامج وحلول تحول على مستوى المؤسسة لتطبيقات الذكاء الاصطناعي الصناعية ، اليوم عن إطلاق Visual Prompting. تأخذ هذه التقنية إطار عمل المطالبة بالنص الموجود في تقنيات مثل ChatGPT وتجلبه إلى رؤية الكمبيوتر. يمكّن هذا التحول التكنولوجي المستخدمين من بناء أنظمة رؤية حاسوبية باستخدام محادثات الدفع المرئي.

تعد المطالبة المرئية إحدى ميزات LandingLens ، المنتج الرئيسي للشركة الذي يجعل رؤية الكمبيوتر سهلة التنفيذ للجميع. LandingLens هي عبارة عن منصة برمجية بديهية تتيح للمستخدمين إنشاء ونشر وتوسيع نطاق تطبيقات الرؤية الحاسوبية الصناعية التي تعمل بالذكاء الاصطناعي – مثل اكتشاف العيوب – بشكل أسرع وبدقة أعلى.

يتطلب سير العمل التقليدي للذكاء الاصطناعي خطوات متعددة: البحث عن البيانات ووضع العلامات عليها ، وتدريب نموذج ثم إجراء التنبؤات. غالبًا ما تكون عملية طويلة ومتسلسلة جدًا حيث لا تعود التعليقات غالبًا إلا في وقت لاحق من الدورة. في المقابل ، فإن واجهات النص مثل ChatGPT لديها عملية أبسط بشكل كبير حيث يعطي المستخدمون مطالبات نصية تقول ما يريدون ، ويحصلون على إجابات بسرعة. ثم يمكن للمستخدمين تكرار استخدام ChatGPT للحصول على مزيد من الأفكار والوضوح. على نفس المنوال ، فإن التحفيز البصري يقلل بشكل كبير من الوقت للحصول على نتيجة رؤية الكمبيوتر من أيام أو شهور إلى دقائق أو حتى ثوانٍ.

قال أندرو نج ، المؤسس والرئيس التنفيذي لشركة Landing AI ، لـ VentureBeat في مقابلة حصرية: “إن منتجنا المرئي الفوري يجعل من السهل على المستخدمين تطوير تطبيقات رؤية جديدة”. “التحفيز المرئي يأخذ التكنولوجيا التحويلية من نص إلى صور وسيضفي طابعًا ديمقراطيًا على إنشاء الذكاء الاصطناعي ويسهل على الجميع استخدام أنظمة الذكاء الاصطناعي المخصصة التي يتم ضبطها وفقًا لبياناتهم وتطبيقهم.”

حدث

تحويل 2023

انضم إلينا في سان فرانسيسكو يومي 11 و 12 يوليو ، حيث سيشارك كبار المسؤولين التنفيذيين في كيفية دمج استثمارات الذكاء الاصطناعي وتحسينها لتحقيق النجاح وتجنب المزالق الشائعة.

سجل الان

لقد رأى عملاء Landing AI بالفعل فوائد التوجيه المرئي في مشاريعهم. على سبيل المثال ، استخدمت Utilight ، وهي شركة تقوم بتطوير تقنيات الليزر المتقدمة لتصنيع الخلايا الشمسية ، Visual Prompting لاكتشاف العيوب الموجودة في الخلايا الشمسية التي لم يكن من الممكن اكتشافها سابقًا بالطرق التقليدية.

تدعي Landing AI أن هذه التكنولوجيا هي أول قدرة تجارية مرئية في العالم ، وقد تم تطويرها بواسطة فريق من الخبراء في رؤية الكمبيوتر ومعالجة اللغة الطبيعية (NLP).

يتوفر Landing AI’s Visual Prompting كإصدار تجريبي عام الآن. بالإضافة إلى ذلك ، دخلت الشركة في شراكة مع كبار المديرين التنفيذيين في مجال التكنولوجيا في العديد من الصناعات ، بما في ذلك التصنيع وعلوم الحياة وصور الأقمار الصناعية والتجزئة لاختبار هذه التكنولوجيا وتطبيقها.

تبسيط رؤية الكمبيوتر من خلال الذكاء الاصطناعي التوليدي

لطالما كان بناء نماذج الذكاء الاصطناعي (AI) مسعىً معقدًا وطويلًا ، وغالبًا ما يتضمن خطوات متعددة مثل وسم البيانات ، والتدريب على النموذج ، والنشر قبل الحصول على أي تنبؤات. لكن الابتكار الجديد ، Visual Prompting ، يهدف إلى تغيير طريقة إنشاء أنظمة الرؤية الحاسوبية.

يمثل التحفيز المرئي تحولًا كبيرًا في سير عمل تطوير الذكاء الاصطناعي من خلال تبسيط وتسريع إنشاء نماذج رؤية الكمبيوتر. باستخدام هذه التقنية ، يمكن للمطورين الاستفادة من الإشارات المرئية لتسمية البيانات بسرعة وكفاءة ، مما يقلل الوقت اللازم لهذه الخطوة الحاسمة.

التكنولوجيا الجديدة مستوحاة من التطورات الحديثة في واجهات نصوص الذكاء الاصطناعي التوليدية مثل ChatGPT ، والتي تبسط عملية تكرار النص لاكتساب رؤى قيمة. من خلال الاستفادة من هذه الابتكارات ، أنشأ مطورو Landing AI أداة جديدة قوية تتيح تكرار نماذج الذكاء الاصطناعي بشكل أسرع وأكثر كفاءة.

“في سير العمل الفوري ، تبتكر” موجهًا مرئيًا “بسيطًا ويمكنك في ثوانٍ البدء في الحصول على تنبؤات. قال أندرو نج ، المؤسس والرئيس التنفيذي لشركة Landing AI ، لـ VentureBeat ، إن هذا يتيح سرعة تطوير التطبيقات بشكل أسرع بكثير. “لحظة GPT-3 – حيث تسهل المطالبة تطوير تطبيقات جديدة – ليست موجودة بعد من أجل رؤية الكمبيوتر ، لكنني أعتقد أن المطالبات المرئية ستقربنا.”

أوضح Ng أن تقنية Visual Prompting تمكن المستخدمين من تحديد موجه مرئي من خلال الطلاء فوق فئات الكائنات التي يرغبون في اكتشافها ، باستخدام صورة واحدة فقط أو بضع صور. ثم تبدأ الخوارزمية فورًا في عمل استنتاجات بناءً على الموجه المقدم من المستخدم. إذا كانت النتائج الأولية دون المستوى ، يمكن للمستخدمين إعادة إدخال الموجه على الفور لتحسين نماذجهم بشكل أكبر ، وتوجيه نظام الذكاء الاصطناعي نحو التعرف بشكل أفضل من خلال إبراز وحدات البكسل المحددة التي يرغبون في تحسينها.

وأضاف أندرو: “تُمكِّن هذه الوظيفة القوية المستخدمين من ضبط نماذجهم بسهولة ، مما يؤدي إلى تكرارات أسرع ودقة أكبر”. “إذا بدت النتائج جيدة ، يمكنك أيضًا النشر إلى نقطة نهاية واجهة برمجة التطبيقات السحابية في السحابة ، ربما في غضون عشرات الثواني. هذا يعني أنه يمكنك الحصول على النموذج الأول وتشغيله ربما في دقائق أو على الأكثر في عدد قليل من الساعات ، واستخدام ذلك لمواصلة التكرار وتحسين أدائه “.

دمقرطة إنشاء الذكاء الاصطناعي

تستفيد أداة Visual Prompting من LandingAI من العديد من نماذج محولات الرؤية الحديثة التي تم تطويرها داخليًا بواسطة فريق من الباحثين المتخصصين في رؤية الكمبيوتر ومعالجة اللغة الطبيعية (NLP). مع هذا الاختراق التكنولوجي ، تستعد الشركة لتحويل سير عمل رؤية الكمبيوتر وجعل إنشاء الذكاء الاصطناعي في متناول الجميع.

يعتقد أندرو أن نجاح تحفيز النص في تحويل معالجة اللغة الطبيعية قد مهد الطريق للابتكار المتفجر في مجال رؤية الكمبيوتر.

“تستكشف العديد من المجموعات في مجال رؤية الكمبيوتر كيفية أخذ أفكار النص المحفز وتكييفها مع الرؤية. على سبيل المثال ، كان عمل Meta الأخير على SAM (تقسيم أي شيء) بمثابة عمل رائع على استخدام المطالبة بمهمة تجزئة الصورة “. “لا يزال هناك الكثير من العمل في المستقبل ، وأتوقع أن تستمر هذه التكنولوجيا في التحسن سريعًا من خلال عملنا وعمل العديد من الآخرين.”

قالت الشركة إن الأداة يتم اختبارها بالفعل عبر صناعات متعددة لحالات استخدام مختلفة. أحد الأمثلة البارزة يتضمن شركة أدوية رائدة متعددة الجنسيات استخدمت التكنولوجيا لإنشاء إثبات في الوقت الفعلي لمفهوم مشروع رؤية كمبيوتر يركز على تقدير الشكل البلوري والنمو من الصور المختبرية. وقد مكنهم ذلك من تطوير نماذج على مجموعة بيانات صغيرة أثناء إزالة عبء التعليقات التوضيحية.

في الآونة الأخيرة ، استخدمت شركة اكتشاف الأجسام المضادة العلاجية OmniAb منصة LandingLens لتحليل الخلايا الفردية في أقراص العسل من خلال Visual Prompting ، والذي يتطلب عمومًا ساعات ، ووضع العلامات اليدوية على مئات الأشكال السداسية.

“مع Visual Prompting ، يمكن لفريقنا بناء نماذج جديدة بسهولة أكبر ، مما يسمح لنا ببناء نماذج مخصصة للتطبيقات الجديدة لتقنيتنا. قال بوب تشين ، كبير المديرين في OmniAb ، لموقع VentureBeat: “كان التأثير الأكبر لـ Visual Prompting في حالات الاستخدام حيث سيكون من الصعب تصنيف جميع الميزات بشكل شامل ، مثل الخلايا في نظامنا للفحص عالي الإنتاجية”. “بفضل الواجهة السريعة البديهية لـ Visual Prompting ، يمكننا تحقيق نتائج عالية الجودة في جزء صغير من الوقت وبجهد أقل بشكل ملحوظ.”

التحديات الحالية وخطط الهبوط المستقبلية للذكاء الاصطناعي

يقول Andrew أن البرنامج لا يعمل على كل شيء لأنه إصدار تجريبي. ومع ذلك ، من بين 40 حالة استخدام قامت LandingAI بتحليلها ، كانت عملية التوجيه المرئي وقدراتها اللاحقة للمعالجة كافية لأكثر من ثلثيها.

“أحد قيود نظامنا الحالي هو أنه أفضل في التمييز بين الفئات ذات القوام / الألوان المختلفة من ميزات الشكل ؛ هذا يعكس محدودية محولات الرؤية المدربة مسبقًا التي نستخدمها. “نحن نواصل العمل على تحسين النظام.”

وأضاف أندرو أن الشركة تخطط لتحسين القدرة الجديدة بناءً على تعليقات المستخدمين وتفاعلاتهم.

قال: “سنواصل تحسين التحفيز المرئي ونتوق إلى المشاركة مع المجتمع لمواصلة تطوير هذه التكنولوجيا معًا”. “مع تحسن محولات الرؤية ، سنواصل أيضًا النظر في كيفية دمج أحدث الأفكار لمساعدة عملائنا بشكل أكبر.”

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.

Comments

No comments yet. Why don’t you start the discussion?

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *