بازیابی اطلاعات از صفحات وب با نشونک

تاریخ انتشار: ۲۲ آبان ۱۳۹۲

 

دسترسی سریع به آخرین اخبار و اطلاعات یکی از اصلی‌ترین پارامترهای مورد نیاز کاربران حرفه‌ای وب است. با توجه به رشد روزافزون وب و وجود انبوهی از منابع اطلاعاتی مختلف وب جاری به یک کتابخانه بزرگ و ارزشمند تبدیل شده است اما چالش اساسی در استفاده از این گنجینه عظیم، این واقعیت است که اطلاعات برای استفاده انسان‌ها آرایش شده‌اند و ماشین‌ها به راحتی نمی‌توانند آن‌ها را پردازش کنند.

نشونک ابزاری قدرتمند برای جستجو در صفحات وب‌سایت‌ها و استخراج اتوماتیک اطلاعات است. این ابزار می‌تواند بصورت اتوماتیک در کل صفحات وب‌سایت بخزد و براساس الگوی تعریف شده، کلیه اطلاعات موجود را شناسایی و واکشی کند و اطلاعات واکشی شده می تواند برحسب نیاز در یک فایل Excel، XML یا جداول بانک اطلاعاتی (مانند sql، access و …) ذخیره گردد.


نشونک با استفاده از اسکریپت نویسی فرایند استخراج را تکمیل نموده و هم‌چنین با بکارگیری تکنیک‌های خاص، انعطاف‌پذیری زیادی نسبت به برخی تغییرات سایت‌ها دارد.

برای آشنایی با نحوه عملکرد نشونک می‌توانید این‌جا را مطالعه کنید.

درباره این مطلب دیدگاهی بنویسید...

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *