موتور جستجو (به انگلیسی: Search Engine) یا جویشگر،
در فرهنگ رایانه، به طور عمومی به برنامهای گفته میشود که کلمات کلیدی را در یک سند یا بانک اطلاعاتی جستجو میکند.
در اینترنت به برنامهای گفته میشود که کلمات کلیدی موجود در فایلها و سندهای وب جهانی، گروههای خبری، و... را جستجو میکند.
در موتور جستجو شما یک واژه ی کلیدی را وارد کرده و برنامه ی جستجو در بانک اطلاعاتی خود به جستجو پرداخته
و سایت های مرتبط با موضوع شما را نمایش خواهند داد.
البته امروزه بیشتر موتورهای جستجو دارای اطلاعات طبقه بندی شده مانند
دایرکتوری ها می باشند و همچنین اکثر دایرکتوری ها قابلیت جستجو مانند
موتورهای جستجو را دارند.
موتورهای جستجو به دو دسته کلی تقسیم میشوند.
موتورهای جستجوی پیمایشی و فهرستهای تکمیلدستی.
هر کدام از آنها برای تکمیل فهرست خود از روشهای متفاوتی استفاده میکنند
البته لازم به ذکر است که گونه ای جدید از موتورهای جستجوگر تحت عنوان "ابر جستجوگر" (Meta Search Engines) نیز وجود دارد
که در ادامه به توضیح هر یک از این موارد خواهیم پرداخت .
موتورهای جستجوی پیمایشی (Crawler-Based Search Engines) مانند گوگل فهرست خود را بصورت خودکار تشکیل میدهند.
آنها وب را پیمایش کرده، اطلاعاتی را ذخیره میکنند،
سپس کاربران از میان این اطلاعات ذخیره شده، آنچه را که میخواهند جستجو میکنند.
اگر شما در صفحه وب خود تغییراتی را اعمال نمایید،
موتورهای جستجوی پیمایشی آنها را به طور خودکار مییابند
و سپس این تغییرات در فهرستها اعمال خواهد شد.
عنوان، متن و دیگر عناصر صفحه، همگی در این فهرست قرار خواهند گرفت.
فهرستهای تکمیلدستی یا (Human-Powered Directories) مانند
فهرست بازی (Open Directory) مانند Dmoz وابسته به کاربرانی است
که آن را تکمیل میکنند. شما صفحه مورد نظر را به همراه توضیحی کوتاه در فهرست ثبت میکنید
یا این کار توسط ویراستارهایی که برای آن فهرست در نظر گرفته شده، انجام میشود.
عمل جستجو در این حالت تنها بر روی توضیحات ثبت شده صورت میگیرد
و در صورت تغییر روی صفحه وب، روی فهرست تغییری به وجود نخواهد آورد.
تأثیری بر بهبود فهرستبندی یک دایرکتوری ندارند. تنها استثناء این است
که یک سایت خوب با پایگاه دادهای با محتوای خوب شانس بیشتری به نسبت یک سایت با پایگاه داده ضعیف دارد.
البته در مورد جستجوگرهای مشهور از جمله گوگل و یاهو، یک مولفه دیگر هم برای بهبود فهرستبندی وجود دارد
که کمک مالی است، یعنی وبگاههایی که مایل به بهبود مکان وبگاه خود در فهرست بندی هستند،
میتوانند با پرداخت پول به این جستجوگرها به هدف خویش برسند.
موتورهای جستجوگرها ترکیبی با نتایج مختلط:
به موتورهایی اطلاق میشود که هر دو حالت را در کنار هم نمایش میدهند.
غالباً، یک موتور جستجوی ترکیبی در صورت نمایش نتیجه جستجو از هر یک از دستههای فوق،
نتایج حاصل از دسته دیگر را هم مورد توجه قرار میدهد.
مثلاً موتور جستجوی ام.اس.ان (MSN) بیشتر نتایج حاصل از فهرستهای تکمیلدستی را نشان میدهد
اما در کنار آن نیم نگاهی هم به نتایج حاصل از جستجوی پیمایشی دارد.
ابر جستجوگرها :
این گونه جدید از موتورهای جستجوگر که قدمت چندانی نیز ندارند
از ترکیب کردن نتایج حاصل از چندین موتورجستجوگر استفاده میکند.
بدین معنی که این موتور عبارت مورد نظر شما را در چندین موتورجستجوگر جستجو میکند
و نتایج آنها را با هم ترکیب کرده و یک نتیجه کلی به شما ارایه میدهد.
بهعنوان مثال موتورجستجوگر داگ پایل از نتایج حاصل از موتورهای
Google - Yahoo - MSN و ASK استفاده کرده و نتیجه حاصل را به شما میدهد.
بررسی یک موتور جستجوگرها پیمایشی:
موتورهای جستجوی پیمایشی شامل سه عنصر اصلی هستند.
اولی در اصطلاح عنکبوت (Spider) است که پیمایشگر (Crawler) هم نامیده میشود.
پیمایشگر همین که به یک صفحه میرسد، آن را میخواند و سپس پیوندهای آن به صفحات دیگر را دنبال مینماید
این چیزیست که برای یک سایت پیمایششده (Crawled) اتفاق افتاده است.
تا تغییرات موجود در آن را بیابد.
هر چیزی که پیمایشگر بیابد به عنصر دوم یک موتور جستجو یعنی فهرست انتقال پیدا میکند.
فهرست اغلب به کاتالوگی بزرگ اطلاق میشود که شامل لیستی از آنچه است که پیمایشگر یافته است.
هرگاه سایتی دچار تغییر شود، این فهرست نیز به روز خواهد شد.
از زمانی که تغییری در صفحهای از سایت ایجاد شده تا هنگامی که آن تغییر در فهرست موتور جستجو ثبت شود
مدت زمانی طول خواهد کشید. پس ممکن است که یک سایت پیمایششده باشد اما فهرستشده نباشد.
نمیتوان انتظار داشت که در نتایج جستجو آن تغییر را ببینیم.
نرمافزار موتور جستجو، سومین عنصر یک موتور جستجو است و به برنامهای اطلاق میشود
که به صورت هوشمندانهای دادههای موجود در فهرست را دستهبندی کرده و آنها را بر اساس اهمیت طبقهبندی میکند
تا نتیجه جستجو با کلمههای درخواست شده هر چه بیشتر منطبق و مربوط باشد.
از دید ما چهار بخش اصلی دارند:
1. جمع آوری کننده اطلاعات (Crawler, Spider, Robot, Bot) : به صفحات مختلف سر می زند (فضولی کردن در وب) محتوای آنها را می خواند اطلاعات مورد نیاز را جمع آوری می کند و در اختیار سایر بخش هایموتور جستجو قرار می دهد.
2. بایگانی کننده داده ها (Indexer)
3. سیستم رتبه بندی (Algorithm Ranking Formula)
4. تحلیلگر درخواست (Query Processor)