موتورهای جستجو چگونه کار میکنند؟
هر موتور جستجو دارای سه عملکرد اصلی است: حرکت آهسته یا خزش برای کشف محتوا، نمایه سازی برای ردیابی و ذخیره محتوا و بازیابی برای بارگیری محتوای مربوطه هنگام استفاده از موتورهای جستجو.
آی تی رسان: برای بسیاری از افراد، جستجوگر گوگل حکم اینترنت را دارد و نقطه شروع برای پیدا کردن سایتهای جدید محسوب میشود و مسلما اختراع آن از اینترنت مهمتر است! بدون موتورهای جستجو دسترسی به حجم عظیمی از محتوای وب امکان پذیر نیست. اما آیا میدانید موتورهای جستجو چگونه کار میکنند؟
هر موتور جستجو دارای سه عملکرد اصلی است: حرکت آهسته یا خزش برای کشف محتوا، نمایه سازی برای ردیابی و ذخیره محتوا و بازیابی برای بارگیری محتوای مربوطه هنگام استفاده از موتورهای جستجو.
خزش یا حرکت آهسته
این مرحله در واقع جایی است که همه چیز شروع میشود، کسب اطلاعات در مورد یک وب سایت. خزش، شامل اسکن کردن سایتها و جمعآوری اطلاعاتی مانند: عنوانها، تصاویر، کلماتکلیدی، سایر صفحات مرتبط و…در مورد هر صفحه میشود. همچنین خزندههای مختلف ممکن است جزئیات مختلفی را جستجو کنند، مانند طرحبندی صفحات، جایی که آگهیها قرار میگیرند و بسیاری موارد دیگر.
اما سوال اینجاست که یک وبسایت چگونه پویش میشود؟
در پاسخ به این سوال باید گفت که یک ربات خودکار موسوم به عنکبوت، با استفاده از لینک صفحات، یکی پس از دیگری صفحات را بازدید میکند. حتی در اولین روزها، عنکبوت گوگل میتواند چند صد صفحه در ثانیه را بخواند. هنگامیکه خزنده وب از یک صفحه بازدید میکند، لینک موجود در صفحه را جمعآوری کرده و آنها را به لیستی از صفحات بعدی که باید بازدید کند، قرار میدهد. پس از پویش یک صفحه طبق لیست، صفحه بعدی بررسی شده و لینکهای آن برای بازدید، مجددا در لیست پویش قرار میگیرند.
خزندههای وب همچنین یکبار و در یک زمان به صفحات گذشته باز میگردند تا ببینند آیا تغییرات جدیدی در صفحه رخ داده است یا خیر. این به این معنی است که هر سایتی که از یک سایت نمایه شده دارای پیوند است، سرانجام کاوش خواهد شد. برخی از سایتها به دفعات بیشتری کاوش میشوند و برخی دیگر که پیچیدگی بیشتری دارند با سرعت کمتری کاوش میشوند. حال اگر صفحه یک سایت بسیار پیچیده باشد خزنده تسلیم می شود و کاوش به پایان میرسد.
یک راه برای فهمیدن اینکه چگونه یک خزنده وب کار میکند، این است خودتان یکبار آن را بسازید البته اگر تجربه برنامه نویسی داشته باشید. توجه داشته باشید که صفحات را میتوان بهعنوان "noindex" علامتگذاری کرد که مانند درخواست موتورهای جستجو برای نمایهسازی مشخص شده است. بخشهای غیر مستند شده از اینترنت به عنوان "وب عمیق" شناخته میشوند و برخی از سایتها، نمیتوانند توسط موتورهای جستجو نمایه شوند.
نمایه سازی
نمایهسازی زمانی انجام میشود که دادهها پردازش شده و در یک پایگاه داده قرار میگیرند. تصور کنید لیستی از تمام کتابهایتان در بخشهای ناشران، نویسندگان، ژانرها، تعداد صفحات و غیره ایجاد کنید. پویش زمانی اتفاق میافتد که هر کتاب را در حالی که نمایه سازی شده است، به لیست خود وارد میکنید. این یک نسخه کوچک از کاری است که گوگل انجام میدهد، این موتور جستجوگر تمام دادهها را در مراکز داده وسیع ذخیره میکند.
بازیابی و رتبهبندی
بازیابی زمانی انجام میشود که موتور جستجو، موضوع جستجوی شما را پردازش میکند و صفحات مربوطه را مطابق با درخواست شما باز میکند. اکثر موتورهای جستجو از طریق روشهای بازیابی خود متمایز میشوند؛ از معیارهای مختلف برای انتخاب گرفته تا انتخاب صفحات مناسب با آنچه که کاربر بهدنبال آن است. اصلا به همین دلیل است که نتایج جستجو بین گوگل و بینگ متفاوت است.
الگوریتم رتبهبندی پرسوجوی جستجوگر خود را در برابر میلیاردها صفحه بررسی کنید تا ارتباط هر یک از آنها را تعیین کنید. معمولا شرکتها بهدلیل پیچیدگی آنها الگوریتمهای رتبهبندی خود را بهعنوان اسرار صنعت ثبت شده، نگه میدارند. طبیعی است؛ یک الگوریتم بهتر به تجربه جستجوی بهتر تبدیل میشود. آنها همچنین نمیخواهند سازندگان وب، سیستم را بازی دهند و ناعادلانه به بالاترین سطح از نتایج جستجو صعود کنند. اگر متدولوژی داخلی یک موتور جستجو بیرون بیایید، همه افراد از این دانش بهره خواهند برد و این امر به ضرر جستجوگرانی مانند شما و من تمام خواهد شد.
در اصل، موتورهای جستجو رتبهبندی سایت را با میزان کلمات کلیدی مناسب که در یک صفحه ظاهر میشود، انجام میدهند.
اهمیت پیوند در اینجا مشخص میشود. در گذشته، موتورهای جستجو سایتها را با توجه به تعداد زیاد لینکهای ورودی ارزشگذاری میکردند زیرا لینک مرتبط را دلیل محبوبیت سایت تفسیر میکردند. اما این کار موجب پیوند هرزنامه در سراسر وب شد. امروزه، موتورهای جستجوگر، قدرت لینک را مرتبط با پیوندهای سایت میدانند. همچنین موتورهای جستجو ارزش بیشتری برای لینکهای یک سازمان دولتی در مقایسه با لینکهای دایرکتوری قائل هستند.
امروزه الگوریتمهای رتبهبندی در رمز و راز بیشتر از همیشه استفاده میشوند و بهینهسازی موتورهای جستجو بسیار مهم نیست. در حال حاضر رتبهبندی موتورهای جستجو بر اساس کیفیت بالای محتوا و تجربیات کاربر صورت میگیرد و اینجاست که اهمیت سئوی سایت بیش از هر چیز مشخص میشود.
آینده موتورهای جستجوی بعدی چیست؟
در حال حاضر یک سوال جالب وجود دارد و پاسخ آن معناشناسی یا به عبارت بهتر معنای محتوای صفحه است. بهعنوان مثال شما میتوانید به جستجوی «کلوچههای بدون گلوتن» بپردازید اما نتایج ممکن است متفاوت باشند. در این مورد، جستجوی کلمات کلیدی به درستی انجام شده اما از نظر معنایی دچار مشکل است. با معناشناسی، شما میتوانید دستورالعملهای مربوط به کلوچهها را جستجو کرده و سپس موارد خاصی مانند آجیل، آرد و…را انتخاب کنید. همچنین میتوانید نتایج را محدود به دستورالعملهایی کنید که کمتر از 30 دقیقه برای آماده سازی آن زمان لازم است و در ادامه لینکهایی با امتیاز 4.5 و یا بیشتر را مطالعه کنید. این آیندهای است که جستجوگرها به آن خواهند رسید.
دیدگاه تان را بنویسید