دسترسی سریع به آخرین اخبار و اطلاعات یکی از اصلیترین پارامترهای مورد نیاز کاربران حرفهای وب است. با توجه به رشد روزافزون وب و وجود انبوهی از منابع اطلاعاتی مختلف وب جاری به یک کتابخانه بزرگ و ارزشمند تبدیل شده است اما چالش اساسی در استفاده از این گنجینه عظیم، این واقعیت است که اطلاعات برای استفاده انسانها آرایش شدهاند و ماشینها به راحتی نمیتوانند آنها را پردازش کنند.
نشونک ابزاری قدرتمند برای جستجو در صفحات وبسایتها و استخراج اتوماتیک اطلاعات است. این ابزار میتواند بصورت اتوماتیک در کل صفحات وبسایت بخزد و براساس الگوی تعریف شده، کلیه اطلاعات موجود را شناسایی و واکشی کند و اطلاعات واکشی شده می تواند برحسب نیاز در یک فایل Excel، XML یا جداول بانک اطلاعاتی (مانند sql، access و …) ذخیره گردد.
نشونک با استفاده از اسکریپت نویسی فرایند استخراج را تکمیل نموده و همچنین با بکارگیری تکنیکهای خاص، انعطافپذیری زیادی نسبت به برخی تغییرات سایتها دارد.
برای آشنایی با نحوه عملکرد نشونک میتوانید اینجا را مطالعه کنید.