Cyrex: February 2005

متخصصان گوگل همواره به خلاقیت و هوشمندی در کارهایشان شهرت یافته اند و اگر نگاهی به روند تکامل و پیشرفت این جستجوگر قدرتمند و خدمات جدیدی که همواره به دنیای اینترنت معرفی می کنند بیندازیم قطعا نتیجه ای غیر از این نمی گیریم. گوگلی ها که همواره در فکر بهبود و دقیق‌تر کردن نتایج جستجوی خود هستند مدتهاست که متوجه یک نقص بزرگ در جستجوگر خود شده اند که البته حل آن به این آسانی ها هم نبود و در واقع شاید برای آنها بسیار وقت گیر یا غیرممکن بود. چندی پیش شاهد خبری مبنی بر به خدمت گرفتن یکی از طراحان اصلی مرورگر فایرفاکس توسط گوگل بودیم که عده ای از آن این طور برداشت کردند که گوگل قصد دارد در آینده مرورگری شبیه به فایرفاکس و در رقابت با مایکروسافت ارائه کند. اما در واقع با وجود مرورگر بازمتنی مثل فایرفاکس چرا گوگل باید چنین کاری انجام دهد و در شرایطی که درگیر رقابت بسیار سنگینی با دیگر رقبای خود است به فکر سرمایه گذاری در پروژه‌ای طولانی مدت که انتظار سود چندانی هم از آن نمی رود باشد؟ همان طور که می دانید صفحات وب حاوی مطالب، نوشته ها، تصاویر و اجزای دیگری هستند که همه آنها توسط تگ‌های HTML در کنار هم قرار می گیرند و یک صفحه وب را می سازند. در واقع این تگ‌های HTML هستند که صفحات وب را آذین بندی می کنند. نحوه نمایش متون مانند نوع فونت، اندازه، ضخامت و رنگ، محل قرار گیری تصاویر و نوشته ها، پیوند به صفحات دیگر و ... همه از طریق این تگها انجام می گیرد. وقتی که شما آدرس یک صفحه اینترنتی را در مرورگر خود وارد می کنید، مرورگر شما تگ‌های موجود در آن صفحه را خوانده و با پردازش آنها صفحه را آنطور که باید نمایش می دهد. اما وقتی که یک موتور جستجو یک صفحه اینترنتی را باز می کند چه اتفاقی می افتد؟ مطمئنا یک برنامه کامپیوتری قصد نگاه کردن به یک صفحه و اجزای بصری آن را ندارد و تنها می خواهد لغات کلیدی و مطالب و موضوع آن صفحه را استخراج کند تا بتواند آن را رتبه بندی کرده و در نتایج جستجوی خود نشان دهد. ((گوگل می خواهد صفحات وب را از دریچه دید یک کاربر اینترنت ببیند)) اما این کار به این آسانی ها هم نیست. بیشتر صفحات وب دارای مطالب و نوشته های فرعی زیادی هستند که هیچ ربطی هم به مطلب اصلی ندارند و حتی گاهی مطلب اصلی در میان آنها گم می شود. به عنوان مثال بسیاری از صفحات وب دارای ستونهایی در سمت چپ و راست صفحه هستند که حاوی لینک به صفحات دیگر، عبارتهای تبلیغاتی، اخبار و ... هستند که همه اینها می تواند جستجوگر را گمراه کند. برای تشخیص مطلب اصلی یک صفحه وب از مطالب دیگر تنها یک راه مطمئن وجود دارد و آن این است که از دریچه دید یک کاربر به صفحه نگاه کرد و از طریق آن در یک صفحه شلوغ بتوان به عنوان مثال عنوان و متن مقاله موجود در صفحه را تشخیص داده و آن را ملاک جستجو برای آن صفحه قرار داد. گوگل هم در واقع دارد به همین سمت پیش می رود و می خواهد از این طریق نتایج خود را دقیق کند. از طرفی همواره در حال مبارزه با اسپمرها بوده است. بسیاری از طراحان وب عبارتهای تبلیغاتی را طوری در درون صفحات خود قرار می دهند که در مرورگر قابل مشاهده نباشد و تنها موتورهای جستجو آن را فهرست کنند که تشخیص این حقه هم تنها از این طریق امکان پذیر می باشد. البته به نظر می رسد که مایکروسافت هم در جستجوگر جدید MSN از روش مشابهی استفاده کرده است. به امید روزی که همه ما بتوانیم با پرسیدن سوال خود از موتورهای جستجو، جواب آن را مستقیما بگیریم.

Cyrex

گوگل و یک گام بزرگ به طرف هوشمند‌سازی جستجو

ÙÙØ´ØªÙâÙØ§Û ÙØ¨ÙÛ

Ø¢Ø±Ø´ÛÙ

ÙÙÙÚ©ÙØ§

Cyrex

document.write(ConvertDateTag("2/17/2005", 7));

گوگل و یک گام بزرگ به طرف هوشمند‌سازی جستجو

ÙÙØ´ØªÙâÙØ§Û ÙØ¨ÙÛ

Ø¢Ø±Ø´ÛÙ

ÙÙÙÚ©ÙØ§

ÙÙØ´ØªÙâÙØ§Û ÙØ¨ÙÛ

Ø¢Ø±Ø´ÛÙ

ÙÙÙÚ©ÙØ§