
مصدر الصورة: آنا إيلي
يعمل نظام Antiplagiat مع النصوص بلغات مختلفة. معظم الأوراق المقدمة للمراجعة مكتوبة باللغة الروسية أو الإنجليزية أو الكازاخستانية. يحتوي فهرس Antiplagiat الآن على مستندات بأكثر من 50 لغة.
خمسة عشر منهم لديهم دعم كامل في جميع مراحل معالجة المستندات. في المستقبل القريب نخطط لتوسيع هذه القائمة بجدية. يتعلم باحثونا الدؤوبون الترجمة حتى من اللغات الرائعة . لغات النص مهمة في عدة مراحل من معالجة الوثائق.
تحتاج إلى معرفة لغة العمليات التالية:
- تقسيم النص إلى كلمات.
- البحث عن الحلول التقنية وإصلاحها ؛
- دمج الواصلة
- التعامل مع الفاصلات وعلامات الترقيم الأخرى ؛
- حساب إحصائيات النص.
- البحث عن القروض.
, NTextCat / CLD3 /CLD2. CLD2 :
- (~200 /c);
- ;
- ( );
- ; , , , ;
- C# ;
- ( 80).
, , .
, , . . , :
CLD2

, – . , , , . . , : , .
, CLD2, . CLD2, .
: ( ).
1: CLD2.
2: , 4.
3: CLD2.
4: .
: , , . , , , « ».
, ( 2)
, . 1-2 (CLD2 ). , . , , , , , - CLD2.
… ( 3)
3.0: , , , .
3.1:
:
- , ( , .. ), , .
- CLD2 .
3.2: , . , , , .
3.3: . CLD2 .

( 4)
, , , . . , , - :
- , ;
- , ;
- .
( ). -. . , , . , . : « «-27».» 4 : «», «"», «», «-27".».
, , , . . , «» , . , 1-2 , . . , . , , . — , , , , : .
, .
, , . . , , , .
- . , , , . — , . . ( 4 ) , , .
, , - . , .
. CLD2:

, . — . — , , .
, CLD2.
, , .

, .

, «» «» , «» — «» – , «Jim» — «him» – , «» , , . CLD2 , .
:

«» . , ( CLD2) , , .
CLD2 , . . . , — .

?
, , . : , , , , . ( !). , «»: , . , , . ( ). , , . , .

– . – . – . .
, . -, CLD2 , 5. -, , . . , .
, , ...