في السنوات الأخيرة ، ظهر التعرف على الكيان (NER) كمهمة حاسمة في معالجة اللغة الطبيعية (NLP) ، مع تطبيقات واسعة النطاق في استخراج المعلومات ، والأسئلة - أنظمة الإجابة ، والترجمة الآلية. كمورد محول مدمج ، أنا متحمس للتغلب على أداء المحولات المدمجة في التعرف على الكيان المسماة.
1. فهم الاعتراف بالكيان المسماة
التعرف على الكيان المسمى هو عملية تحديد وتصنيف الكيانات المسماة المذكورة في النص في فئات محددة مسبقًا مثل أسماء الأشخاص والمؤسسات والمواقع والتواريخ والقيم النقدية. على سبيل المثال ، في الجملة ، تخطط "Apple Inc." لفتح متجر جديد في نيويورك الشهر المقبل "، ستقوم NER بتحديد" Apple Inc. " كمنظمة ، "نيويورك" كموقع ، و "الشهر المقبل" كتاريخ.
تعتمد طرق NER التقليدية غالبًا على الأنظمة القائمة على القاعدة أو خوارزميات التعلم الآلي مثل نماذج Markov المخفية (HMMS) والحقول العشوائية الشرطية (CRFs). أظهرت هذه الطرق أداءً جيدًا في كثير من الحالات ، لكنها تواجه تحديات عند التعامل مع الهياكل اللغوية المعقدة والكيانات النادرة.
2. ظهور النماذج القائمة على المحولات في NER
النماذج القائمة على المحولات ، مثل BERT (تمثيلات التشفير ثنائية الاتجاه من المحولات) ، أحدثت ثورة في مجال NLP. يتم تدريب هذه النماذج مسبقًا على كميات كبيرة من البيانات النصية ويمكنها التقاط معلومات دلالية غنية. لقد تم استخدامها على نطاق واسع في مهام NER وحققت حالة - من الأداء الفني.
ومع ذلك ، فإن نماذج المحولات الكاملة - غالبًا ما تحتوي على عدد كبير من المعلمات ، مما يؤدي إلى ارتفاع تكاليف حسابية وأوقات تدريب طويلة. وقد حد هذا نشرها في البيئات المقيدة في الموارد ، مثل الأجهزة المحمولة أو منصات الحوسبة الحافة.
3. ما هي المحولات المدمجة؟
تم تصميم المحولات المدمجة لمعالجة مشكلات التوسع والكفاءة في نماذج المحولات التقليدية. أنها تحقق ذلك من خلال تقليل عدد المعلمات مع الحفاظ على الأداء العالي. تستخدم المحولات المدمجة تقنيات مختلفة ، مثل التقليم والتكميلية وتقطير المعرفة ، لضغط حجم النموذج.
يتضمن التقليم إزالة الروابط أو الخلايا العصبية غير الضرورية في بنية المحولات ، مما يقلل من عدد المعلمات دون التأثير بشكل كبير على أداء النموذج. الكمي ، من ناحية أخرى ، يقلل من دقة أوزان النموذج وتفعيله ، والتي يمكن أن تؤدي إلى انخفاض كبير في استخدام الذاكرة والمتطلبات الحسابية. ينقل تقطير المعرفة المعرفة من نموذج "مدرس" كبير إلى نموذج "طالب أصغر" ، مما يتيح نموذج الطالب من تحقيق أداء مماثل مع عدد أقل من المعلمات.
4. أداء المحولات المدمجة في ner
4.1 الدقة
أحد التدابير الأساسية للأداء في NER هو الدقة ، وهي نسبة الكيانات المسماة التي تم تحديدها بشكل صحيح. أظهرت المحولات المدمجة نتائج واعدة من حيث الدقة. من خلال الاستفادة من المعرفة المسبقة المُدربة بنماذج المحولات الأكبر من خلال تقنيات مثل تقطير المعرفة ، يمكن للمحولات المدمجة التقاط الأنماط الدلالية والبنية ذات الصلة بـ NER.
على سبيل المثال ، في دراسة حديثة على مجموعة بيانات NER القياسية ، حقق نموذج محول مدمج درجة F1 (مقياس متوازن للدقة والاستدعاء) أقل قليلاً من نموذج محول المقياس الكامل. كانت درجة F1 - من المحول المدمج حوالي 90 ٪ ، في حين حقق نموذج المقياس الكامل درجة F1 - 92 ٪. يشير هذا إلى أن المحولات المدمجة يمكن أن توفر نتائج NER عالية الجودة مع بنية نموذجية أكثر كفاءة.
4.2 الكفاءة
الميزة الأكثر أهمية للمحولات المدمجة في NER هي كفاءتها. فيما يتعلق بالموارد الحسابية ، تتطلب المحولات المدمجة ذاكرة أقل وعمليات نقاط عائمة أقل (تتخبط) مقارنة بنماذج محولات المقياس الكاملة. هذا يجعلها مناسبة للنشر في تطبيقات الوقت الحقيقي ، حيث تكون أوقات الاستجابة السريعة حاسمة.
على سبيل المثال ، في نظام تحليل مقالات Time -Time -Time ، يمكن للمحول المدمج معالجة مقال إخباري واستخراج الكيانات المسمى أسرع بكثير من محول المقياس الكامل. وذلك لأن العدد المخفض للمعلمات يسمح بالاستدلال بشكل أسرع ، مما يتيح للنظام تقديم معلومات في الوقت المناسب للمستخدمين.
4.3 التعميم
توضح المحولات المدمجة أيضًا قدرة تعميم جيدة في مهام NER. يمكنهم التكيف مع أنواع مختلفة من البيانات النصية والأداء بشكل جيد على مختلف مجموعات بيانات NER. وذلك لأن عملية التدريب المسبقة للمحولات المدمجة تلتقط أنماط اللغة العامة التي تنطبق عبر مجالات مختلفة.
على سبيل المثال ، يمكن استخدام نموذج محول واحد مضغوط لـ NER في كل من الأدب الطبي والأخبار المالية. في حين أن هناك اختلافات محددة في مجال الكيانات واستخدام اللغة ، إلا أنه لا يزال بإمكان المحول المدمج تحديد وتصنيف الكيانات بدقة ، وذلك بفضل قدرتها على التعميم من المعرفة المسبقة.
5. تطبيقات المحولات المدمجة في ner
5.1 استخراج المعلومات
في أنظمة استخراج المعلومات ، يمكن استخدام المحولات المدمجة لاستخراج الكيانات المسمى بسرعة من كميات كبيرة من البيانات النصية. على سبيل المثال ، في نظام تحليل المستندات القانونية ، يمكن للمحولات المدمجة تحديد الأطراف المعنية والتواريخ والقيم النقدية في العقود القانونية ، والتي تساعد المحامين والباحثين القانونيين على الوصول بسرعة إلى المعلومات ذات الصلة.
5.2 سؤال - الإجابة على أنظمة
في السؤال - الإجابة على أنظمة ، NER ضروري لفهم سياق السؤال وتقديم إجابات دقيقة. يمكن دمج المحولات المدمجة في هذه الأنظمة لتحسين كفاءة استخراج الكيان المسماة. على سبيل المثال ، في chatbot خدمة العملاء ، يمكن لـ Compact Transformers تحديد أسماء المنتجات والمواقع والعملاء المذكورة في سؤال المستخدم ، مما يمكّن من chatbot تقديم ردود أكثر صلة.
6. عروض المحولات المدمجة لدينا
كمورد محول مدمج ، نقدم مجموعة من منتجات المحولات المدمجة عالية الأداء. ملكنامحولات مدمجةتم تصميمها مع أحدث تقنيات الضغط لضمان دقة وكفاءة عالية في مهام NER.


نحن نقدم أيضامحول محطة فرعية مدمجةالحلول ، التي تم تحسينها لسيناريوهات تطبيق محددة. هذه المحولات مناسبة للاستخدام في الأنظمة الموزعة حيث تكون إدارة الموارد أمرًا بالغ الأهمية.
بالإضافة إلى ذلك ، لديناطاقة جديدة متكاملة من الطاقة الكهروضوئية المدمجة مسبقا كابينة المحولات MV و HV القطع - معدات توزيع الحافةيمكن دمجها مع أنظمة NER في مجال الطاقة الجديد. على سبيل المثال ، يمكن استخدامها لاستخراج الكيانات المسمى من التقارير والمستندات ذات الصلة بالطاقة ، مما يساعد على إدارة بيانات الطاقة وتحليلها بشكل أكثر فعالية.
7. الخلاصة
في الختام ، أظهرت المحولات المدمجة أداءً ممتازًا في مهام التعرف على الكيانات المسماة. أنها توفر توازن جيد بين الدقة والكفاءة وقدرة التعميم. مع زيادة الطلب على تطبيقات NLP الحقيقية والموارد ، أصبحت المحولات المدمجة خيارًا جذابًا لـ NER.
إذا كنت مهتمًا باستكشاف إمكانات المحولات المدمجة في مشاريع NER الخاصة بك ، فإننا ندعوك للاتصال بنا للمشتريات والمزيد من المناقشات. فريق الخبراء لدينا مستعد لتزويدك بحلول مخصصة ودعم فني لتلبية متطلباتك المحددة.
مراجع
- Devlin ، J. ، Chang ، MW ، Lee ، K. ، & Toutanova ، K. (2018). بيرت: قبل تدريب محولات ثنائية الاتجاه العميقة لفهم اللغة. Arxiv preprint Arxiv: 1810.04805.
- Han ، S. ، Pool ، J. ، Tran ، J. ، & Dally ، W. (2015). تعلم كل من الأوزان والاتصالات للشبكات العصبية الفعالة. في التقدم في أنظمة معالجة المعلومات العصبية.
- Hinton ، G. ، Vinyals ، O. ، & Dean ، J. (2015). تقطير المعرفة في الشبكة العصبية. Arxiv preprint Arxiv: 1503.02531.
