جريدة الإتحاد - 10/22/2025 10:49:30 AM - GMT (+4 )

أعلن المطورون الصينيون لنموذج Deepseek AI عن إطلاق نسخة جديدة، DeepSeek-OCR، والتي تعد خطوة ثورية في عالم الذكاء الاصطناعي، حيث تمكن من تحويل النصوص والمستندات الضخمة إلى صور قبل تحليلها.
ثورة Deepseek
هذا الابتكار يسمح للنظام بالتعامل مع كميات ضخمة من البيانات باستخدام بين سبعة و20 ضعفًا أقل من الرموز، مع الحفاظ على مستوى دقة مرتفع، ما يعكس قدرة النموذج على تقليل تكلفة التشغيل وزيادة الكفاءة بشكل كبير مقارنة بالطرق التقليدية لمعالجة النصوص.
يتميز النموذج بوجود مكونين أساسيين، الأول هو DeepEncoder المسؤول عن تحويل النصوص إلى صور عالية الدقة، بينما الثاني هو DeepSeek3B-MoE-A570M الذي يعمل كمفكك للترميز، قادر على استيعاب النصوص ضمن الصور بكفاءة استثنائية مع استهلاك أقل للموارد. وتعتمد طريقة عمل النموذج على تقسيم المهام إلى شبكات فرعية متخصصة، تستعين بوكلاء ذكاء اصطناعي خبراء لكل جزء من البيانات، ما يجعله فعالًا بشكل خاص في التعامل مع الجداول والرسوم البيانية والمخططات المعقدة، ويتيح تطبيقه في مجالات متعددة مثل المالية والعلوم والطب.
ضغط الرموز
أظهرت اختبارات النموذج أن تقليل الرموز بمقدار أقل من عشرة أضعاف يسمح بالحفاظ على دقة تصل إلى 97%، بينما يؤدي الضغط الأكبر إلى انخفاض الدقة إلى 60%، مما يظهر وجود تنازلات عند زيادة ضغط البيانات، لكنه يؤكد أيضًا أن أي ضغط معتدل بنسبة 1-2 مرة يمكن أن يُحدث فرقًا هائلًا في تقليل تكلفة تشغيل النماذج الحديثة للذكاء الاصطناعي، دون التضحية بالدقة. وتستهدف هذه التقنية أيضًا تطوير بيانات تدريبية للنماذج المستقبلية، مع ضرورة الانتباه إلى أن أي أخطاء بسيطة قد تنشأ عن ضغط المعلومات يمكن أن تؤثر على النتائج، لذا يجب توخي الحذر في هذه المرحلة.
ذكاء بصري
ويشير المطورون إلى أن نموذج DeepSeek-OCR متاح الآن على منصات Hugging Face وGitHub، ما يتيح للمطورين والباحثين فرصة استكشاف إمكانياته، وفهم كيفية تحويل النصوص الضخمة والمستندات المعقدة إلى صور بطريقة فعالة، مع الحفاظ على سرعة المعالجة وتقليل استهلاك الموارد، وهو ما يمثل قفزة نوعية في قدرة الذكاء الاصطناعي على التعامل مع البيانات الكبيرة والمعقدة.
يُعتبر هذا الابتكار استمرارًا لنجاحات Deepseek التي أثارت إعجاب العالم في أوائل 2025، عندما أظهرت قدرات مشابهة لتلك التي تقدمها نماذج OpenAI مثل ChatGPT أو Google Gemini، إلا أنها تتطلب ميزانية وبيانات أقل بكثير لتطويرها.
ومع إطلاق DeepSeek-OCR، يعزز المطورون مكانة النموذج كأحد الحلول الواعدة في عالم الذكاء الاصطناعي متعدد الوسائط، حيث يمكنه معالجة كميات ضخمة من النصوص بكفاءة عالية، مع إمكانية الاستفادة منه في التطبيقات التجارية والعلمية والطبية.
إسلام العبادي(أبوظبي)
إقرأ المزيد