การสืบค้นข้อมูลทางอินเตอร์เน็ต
การสืบค้นสารสนเทศ (Information Retrieval)เป็นกระบวนการในการค้นหาสารสนเทศ ที่จัดเก็บในทรัพยากรสารสนเทศประเภทต่างๆ หรือแหล่งสารสนเทศประเภทต่างๆ ที่สารสนเทศถูกจัดเก็บไว้ตามหัวข้อ หรือตามประเภทของทรัพยากร สารสนเทศ ในปัจจุบันการค้นหาสารสนเทศ สามารถค้นได้จากเครื่องคอมพิวเตอร์ที่เชื่อมต่อกับโปรแกรมจัดเก็บและค้นคืนสารสนเทศ รวมทั้งการเชื่อมต่อกับระบบเครือข่ายอินเทอร์เน็ต เพื่อให้ผู้ค้นได้รับสารสนเทศที่ ตรงกับความต้องการในการนำไปใช้ประโยชน์ให้มากที่สุด
กระบวนการค้นคืนสารสนเทศ
การกำหนดคำค้น
การค้นโดยใช้คำศัพท์ควบคุม
(Controlled Vocabulary)
การค้นโดยใช้คำศัพท์แบบไม่ควบคุม
(Uncontrolled Vocabulary)
มีการเรียกแตกต่างกันออกไปดังนี้
-ห้องสมุดเรียก หัวเรื่อง เนื้อเรื่อง (Subject)
-ฐานข้อมูลเชิงพาณิชย์เรียก ศัพท์สัมพันธ์ (Thesaurus)
-กำหนดคำเพื่อใช้แทนเนื้อหาสาระโดยรวมของสารสนเทศ
เช่น หัวเรื่อง พืชน้ำมัน หมายความถึง พืชทุกชนิดที่ให้น้ำมัน
เช่น ละหุ่ง ปาล์ม มะพร้าว ฯลฯ
ข้อดีของการค้นจากคำศัพท์ควบคุม
ได้ผลการค้นที่ตรงกับความต้องการมากที่สุด
ผลการค้นไม่เยอะจนเกินความจำเป็น
ข้อเสียของการค้นจากคำศัพท์ควบคุม
ไม่สามารถกำหนดคำที่ต้องการค้นได้ถูกต้องตามที่ห้องสมุดได้กำหนดไว้ เช่น เรื่องโลกร้อน ห้องสมุดกำหนดหัวเรื่องไว้ว่า
“ภาวะโลกร้อน” หากผู้ใช้กำหนดคำค้นว่า “โลกร้อน” ก็จะหาไม่เจอ เป็นต้น
นิยมเรียกกันว่าค้นแบบใช้ คำสำคัญ (Keyword)
ผู้ใช้สามารถกำหนดคำค้นได้ตามความต้องการโดยไม่ต้องคำนึงว่าจะตรงกับคำที่ห้องสมุดจัดไว้หรือไม่
คำสำคัญต้องอยู่ในรูปของคำศัพท์ หรือ วลี ไม่ใช่ประโยค
ตัวอย่าง ต้องการค้นเรื่อง
“ความรู้ทั่วไปเกี่ยวกับโรคไข้หวัดใหญ่“
การกำหนดคำค้น ต้องเป็นคำว่า “โรคไข้หวัดใหญ่“ หรือ “ไข้หวัดใหญ่“
ข้อดีของการค้นจากคำศัพท์แบบไม่ควบคุม
-ผู้ใช้สามารถกำหนดคำได้อย่างอิสระ สะดวกในการค้น
-สามารถกำหนดคำค้นได้จากคำศัพท์ใหม่ๆ ที่ยังไม่ได้มีการกำหนดคำศัพท์ควบคุมไว้
ข้อเสียของการค้นจากคำศัพท์แบบไม่ควบคุม
-ผลการค้นได้เอกสารมากเกินความจำเป็น
-เอกสารบางอย่างที่ค้นไม่ได้ตรงกับความต้องการ
-ผลการค้นไม่เที่ยงตรงเท่ากับการใช้หัวเรื่อง แต่ค้นได้ง่ายกว่าและเยอะกว่า
-การใช้บูลีน (Boolean)
-การค้นเป็นวลี (Phrase Search)
-การค้นแบบตัดปลาย (Truncation)
-การกำหนดค้นเฉพาะส่วน (Field Search)
-การจำกัดการค้น (Search Limit)
ตรรกะบูลีน ได้แก่ AND OR NOT NEAR
วิธีการใช้
AND ใช้กำหนดค้นคำที่ต้องการให้ปรากฏทั้งหมด
OR ใช้กำหนดค้นคำที่ต้องการให้ปรากฏทั้งหมด หรือคำใดคำหนึ่งก็ได้
NOT ใช้เมื่อต้องการตัดคำที่มีเนื้อหาที่ไม่ต้องการออก
NEAR ใช้ในการกำหนดระยะห่างของคำที่กำหนด
การค้นเป็นวลี ก็เพื่อหลีกเลี่ยงการค้นที่คลาดเคลื่อนอันเนื่องมาจาก
คำนั้นเป็นชื่อบุคคล สถานที่ ชื่อหนังสือ หรือคำที่เขียนไม่ติดกัน
เช่น บารัค โอบามา ผลค้น อาจจะเป็น บารัค โอบามา หรือ มิเชล โอบามา หรือ … โอบามา
ดังนั้น ผู้ใช้ต้องใช้การค้นแบบวลีช่วยในการกำหนดคำค้นดังนี้
“บารัค โอบามา” เป็นต้น
เรียกอีกอย่างหนึ่งว่า การใช้ wildcard เป็นการกำหนดการค้นโดยใช้เครื่องหมายตัดปลายโดยกำหนดจากคำหลักแล้วใช้เครื่องหมายตัดปลายวางหลังตัวอักษรหรือระหว่างตัวอักษร เช่น
COMPUTER ใช้เครื่องหมายตัดปลายคือ COMPUT*
ผลที่ได้จะเป็นคำเหล่านี้ COMPUTE
COMPUTER
COMPUTERING
หรืออาจแทรกระหว่างตัวอักษรเช่น ORGANI*ATION
ผลที่ได้จะเป็น ORGANIZATION และ ORGANISATION
แหล่งรวบรวมข้อมูลที่ใหญ่ที่สุดในอินเทอร์เน็ตทำการเปรียบเทียบ คำที่กำหนดค้น กับดรรชนีคำ ว่ามีความตรงกันมากน้อยเพียงใด นำผลค้นมาจัดลำดับความเกี่ยวข้องกับคำที่กำหนดค้นโดยแสดงปริมาณความเกี่ยวข้อง อาจแสดงเป็นร้อยละ หรือ จัดลำดับความสำคัญ หรือ วันที่
1. จัดทำโดยโปรแกรมจัดเก็บ
INDEX SEARCH โปรแกรมค้นหาแบบดรรชนี
-อาจเรียกว่า keyword search engine
-ใช้Agent หรือ Spider หรือ Robot ในการตรวจสอบเว็บไซต์
-เข้าทำการสำรวจเว็บเพจที่มีในเครือข่ายหรือปรับปรุงเปลี่ยนแปลงข้อมูลใหม่ที่มีการเปิดดู
-นำรายการผลการสำรวจ เช่น ชื่อเรื่อง เนื้อหาโดยย่อ และ URL จัดเก็บในฐานข้อมูล
Uniform Resource Locator
-สร้างดรรชนีของข้อมูลในหน้าเว็บเพจ
-ทำการเชื่อมโยงระหว่างดรรชนีและฐานข้อมูล
-จัดเก็บเว็บเพจไว้ในฐานข้อมูลของตัวเอง
ข้อควรทราบเกี่ยวกับ Index Search
-ค้นได้เว็บไซต์ทันสมัย
-Spider ค้นหาเว็บเพจอยู่ตลอดเวลา
-นำมาทำดรรชนีค้นทันที
-ได้ผลค้นจำนวนมาก
-เว็บเพจที่ได้ต้องนำมาประเมินก่อนใช้ ถึงความน่าเชื่อถือ
-ผู้ใช้ควรทราบเกี่ยวกับวิธีการกำหนดค้น
- Boolean Proximity Truncate (---)
-ไม่มีฐานข้อมูลเป็นของตัวเอง
-สืบค้นข้อมูลจาก Search Engine อื่นๆ
-นำผลค้นที่ได้มาเรียงตามลำดับ
-สามารถเลือกสืบค้นพร้อมกันจากหลายๆ Search Engineในการค้นเพียงครั้งเดียวและหน้าจอเดียว
Subject Directory Search
-จัดกลุ่มเว็บเพจตามเนื้อหาที่ปรากฏ
-ใช้คนในการตรวจสอบ
-แบ่งเป็นกลุ่มเรื่องใหญ่ๆ
-แต่ละกลุ่มจะแบ่งเป็นเรื่องย่อยๆต่อไปเรื่อยๆ
-แสดงจำนวนรายการที่มีข้อมูล และแหล่งที่ปรากฏข้อมูล
ข้อควรทราบเกี่ยวกับ Subject Directory Search
-ฐานข้อมูลมีจำนวนน้อย
-ได้ข้อมูลที่ตรงต่อความต้องการ
-มีการตรวจสอบเนื้อหาตรงกับหัวเรื่องโดยใช้มนุษย์
-การแบ่งเป็นกลุ่มจะแบ่งเป็นกลุ่มใหญ่ และแบ่งเป็นกลุ่มย่อยๆ
-การค้นต้องเปิดหลายหน้าต่าง จนถึงข้อมูลที่ต้องการ
-ข้อมูลที่ได้จะไม่ค่อยมีความทันสมัย
Specific Search
-ใช้ค้นข้อมูลเฉพาะสาขาวิชา หรือข้อมูลเฉพาะด้าน
-ใช้ค้นหาแหล่งที่มี บริการฐานข้อมูล
-นิยมทำเป็นแบบนามานุกรมเหมือนแบบ Directory Search
-จัดทำโดยบรรณารักษ์ ผู้เชี่ยวชาญ หน่วยงานเฉพาะ
-วัตถุประสงค์เพื่อการค้นคว้าวิจัยเฉพาะด้าน
ไม่มีความคิดเห็น:
แสดงความคิดเห็น