2011-11-02

Tutorial E: Enjin carian (search engine) dan strategi carian







Apakah itu enjin carian(search engine)??

Enjin carian ialah sebuah pangkalan data yang menyimpan segala pautan laman web dan kata kunci atau frasa.

Sebagai contohnya apabila anda menaip TEKNOLOGI MAKLUMAT pada enjin carian, enjin carian akan mencari mengikut kata kunci yang dimasukkan di dalam indeks pangkalan data. Hasilnya, apabila kata kunci yang dimasukkan dijumpai, maka segala lamanweb yang berkaitan dengan kata kunci akan dipaparkan kepada anda. 

Namun, tidak semua enjin carian mempunyai konsep yang sama

Contoh Enjin Carian ialah : 



Sebenarnya, terdapat pelbagai contoh enjin carian dalam internet. Tiga contoh enjin carian yang paling banyak digunakan dan disukai oleh orang ramai disebabkan mesra pengguna ialah Google, Yahoo,baidu dan Bing.

The three most widely used web search engines and
their approximate share as of late 2010.



How web search engines work?

Web Crawling
Laman yang diambil daripada crawler Web (kadang-kadang juga dikenali sebagai labah-labah-spider) 
Spider adalah  untuk membina senarai perkataan yang terdapat pada laman web. Apabila labah-labah membina senaraiproses ini dinamakan web crawling
Dalam usaha untuk membina dan mengekalkan senarai perkataan yang berguna, labah-labah enjin carian telah melihat banyak muka surat.

How does any spider start its travels over the Web?


  • The usual starting points are lists of heavily used servers and very popular pages. 
  • The spider will begin with a popular site, indexing the words on its pages and following every link found within the site. In this way, the spidering system quickly begins to travel, spreading out across the most widely used portions of the Web.



Apabila labah-labah telah menyelesaikan tugas mencari maklumat pada halaman Web, enjin carian perlu menyimpan maklumat dengan cara yang menjadikan maklumat ini berguna. 
 -Terdapat dua komponen utama yang terlibat dalam membuat data yang dikumpul dan boleh diakses oleh pengguna:
(i)Maklumat yang disimpan dengan menggunakan data
(ii)Kaedah di mana maklumat yang diindeks

Tujuan indeks adalah untuk membolehkan maklumat akan ditemui secepat mungkin.  



Building a Search
-Apabila pengguna memasukike dalam enjin carian (biasanya dengan menggunakan kata kunci),enjin tersebut akan memeriksa indeks dan menyediakan satu penyenaraian halaman web terbaik dan padan mengikut kriteria yang telah ditetapkan.

-Biasanya dengan ringkasan yang pendek yang mengandungi tajuk dokumen itu dan kadang-kadang dengan sebahagian teks sahaja.  





Rujukan: 







1 comment:

  1. Valuable information! Used storage servers and SAN switches provide a sustainable solution for expanding storage capacity.

    ReplyDelete