مشکل سرقت علمی ادبی، قرنهاست، وجود دارد. بااین حال، گسترش انتشار فناوری اطلاعات ازجمله اینترنت به آسانی سرقت علمی ادبی را میسازد. درنتیجه روشها و سیستمهای کمک در تشخیص سرقت علمی ادبی تحقیقات زیادی را در دو دهه ی گذشته به خود جلب کرده است.
محققان انواع راه حلها را ارائه داده اند. سیستمهای تشخیص موجود استفاده شده برای مقایسه کاراکترهای مبتنی بر متون پیچیده و بسیار کارآمد است که میتواند منجر به شناسایی مطمئن کلمه به کلمه و کپی های پنهانی شود. در این مقاله به بررسی روش تشخیص سرقت علمی ادبی تطبیق اثرانگشت به همراه نقاط ضعف و قوت و کارهای انجام گرفته، ارائه شده است
امروزه با گسترش فناوریهای نوین و دسترسی بیشتر به منابع علمی از طریق اینترنت و سهولت دسترسی به سختافزار لازم جهت انتشار منابع علمی در بستر فناوری اطلاعات، خطر دستبرد علمی و کپیبرداری غیر مجاز از منابع نیز به همان نسبت گسترش یافته است. هرگونه استفاده یا کپیبرداری هوشمندانه و یا عمدی از ایدهها، گفتارها، عبارات ادبی و یا نتایج دستاوردهای تحقیقی دیگران، بدون اجازه پدیدآورنده سرقت علمی محسوب میشود و جامعه امروزی باید برای مبارزه با این نوع سرقت که معمولاَ مجازاتی نیز در پی ندارد راه حلی بیابد.
همتاجو سامانهای مبتنی بر وب میباشد که میتواند مشابهتهای متنی موجود میان اسناد علمی منتشر شده را شناسایی نماید. نرم افزار تشخیص سرقت علمی همتاجو به صورت کاملا هوشمند طراحی شده که با استفاده از الگوریتم های هوش مصنوعی می تواند شباهت های متنی موجود میان مقاله علمی مشکوک را با مجموعه مقالات علمی پژوهشی کشور در پایگاه SID استخراج کرده و با استفاده از روشی هوشمند نتایج را بر اساس میزان مشابهت نمایش دهد.
این سامانه علاوه بر تشخیص جملات یکسان و جابجایی کلمات، قابلیت شناسایی عبارات جایگزین شده و کشف سرقت علمی بازنویسی شده بر مبنای شبکه معنایی (Semantic Network) و روش های مشابهت یابی معنایی دارد.
ادغام دو جمله در یک جمله و یا شکستن یک جمله به دو جمله توسط همتاجو قابل تشخیص خواهد بود.
ویژگی دیگر این سامانه، اهمیت دادن به بخشهای خاص مقاله بر اساس اهمیت آن بخش در امر سرقت علمی است. در حال حاضر قابلیت سامانه صرفا در حوزه منابع فارسی است.
در حال حاضر سامانه همتاجو بخشی از منابع و مقالات منتشر شده در نشریات و همایشهای داخلی را پشتیبانی میکند. این داده شامل هزاران مقاله و منابع علمی مختلف از بانک و پایگاه استنادی نشریات علمی (فارسی-انگلیسی) و مجامع علمی کشور است و بصورت دائمی بهروز رسانی میشود. سامانه همتاجو با استناد به این منابع اطلاعاتی حجم وسیعی از منابع فارسی موجود در کشور را تحت پوشش قرار داده است.