بازیابی اطلاعات از صفحات وب با نشونک

 

دسترسی سریع به آخرین اخبار و اطلاعات یکی از اصلی‌ترین پارامترهای مورد نیاز کاربران حرفه‌ای وب است. با توجه به رشد روزافزون وب و وجود انبوهی از منابع اطلاعاتی مختلف وب جاری به یک کتابخانه بزرگ و ارزشمند تبدیل شده است اما چالش اساسی در استفاده از این گنجینه عظیم، این واقعیت است که اطلاعات برای استفاده انسان‌ها آرایش شده‌اند و ماشین‌ها به راحتی نمی‌توانند آن‌ها را پردازش کنند.

نشونک ابزاری قدرتمند برای جستجو در صفحات وب‌سایت‌ها و استخراج اتوماتیک اطلاعات است. این ابزار می‌تواند بصورت اتوماتیک در کل صفحات وب‌سایت بخزد و براساس الگوی تعریف شده، کلیه اطلاعات موجود را شناسایی و واکشی کند و اطلاعات واکشی شده می تواند برحسب نیاز در یک فایل Excel، XML یا جداول بانک اطلاعاتی (مانند sql، access و …) ذخیره گردد.

نشونک با استفاده از اسکریپت نویسی فرایند استخراج را تکمیل نموده و هم‌چنین با بکارگیری تکنیک‌های خاص، انعطاف‌پذیری زیادی نسبت به برخی تغییرات سایت‌ها دارد.

برای آشنایی با نحوه عملکرد نشونک می‌توانید این‌جا را مطالعه کنید.

تاریخ انتشار:

درباره این مطلب دیدگاهی بنویسید...

نشانی ایمیل شما منتشر نخواهد شد.