วันจันทร์ที่ 16 มีนาคม พ.ศ. 2563

การสืบค้นสารสนเทศ

การสืบค้นสารสนเทศ

  การสืบค้นข้อมูลทางอินเตอร์เน็ต  

        การสืบค้นสารสนเทศ (Information Retrieval)
เป็นกระบวนการในการค้นหาสารสนเทศ ที่จัดเก็บในทรัพยากรสารสนเทศประเภทต่างๆ หรือแหล่งสารสนเทศประเภทต่างๆ ที่สารสนเทศถูกจัดเก็บไว้ตามหัวข้อ หรือตามประเภทของทรัพยากร สารสนเทศ ในปัจจุบันการค้นหาสารสนเทศ สามารถค้นได้จากเครื่องคอมพิวเตอร์ที่เชื่อมต่อกับโปรแกรมจัดเก็บและค้นคืนสารสนเทศ รวมทั้งการเชื่อมต่อกับระบบเครือข่ายอินเทอร์เน็ต เพื่อให้ผู้ค้นได้รับสารสนเทศที่ ตรงกับความต้องการในการนำไปใช้ประโยชน์ให้มากที่สุด 

        กระบวนการค้นคืนสารสนเทศ
ผลการค้นหารูปภาพสำหรับ กระบวนการค้นคืนสารสนเทศ

          การกำหนดคำค้น

การค้นโดยใช้คำศัพท์ควบคุม 
(Controlled Vocabulary)

การค้นโดยใช้คำศัพท์แบบไม่ควบคุม 

(Uncontrolled Vocabulary)

   การค้นโดยใช้คำศัพท์ควบคุม (Controlled Vocabulary)
มีการเรียกแตกต่างกันออกไปดังนี้
-ห้องสมุดเรียก หัวเรื่อง เนื้อเรื่อง (Subject)
-ฐานข้อมูลเชิงพาณิชย์เรียก ศัพท์สัมพันธ์ (Thesaurus)
-กำหนดคำเพื่อใช้แทนเนื้อหาสาระโดยรวมของสารสนเทศ
เช่น หัวเรื่อง พืชน้ำมัน หมายความถึง พืชทุกชนิดที่ให้น้ำมัน

เช่น ละหุ่ง ปาล์ม มะพร้าว ฯลฯ

                 ข้อดีของการค้นจากคำศัพท์ควบคุม 
ได้ผลการค้นที่ตรงกับความต้องการมากที่สุด
ผลการค้นไม่เยอะจนเกินความจำเป็น

                 ข้อเสียของการค้นจากคำศัพท์ควบคุม 
ไม่สามารถกำหนดคำที่ต้องการค้นได้ถูกต้องตามที่ห้องสมุดได้กำหนดไว้ เช่น เรื่องโลกร้อน ห้องสมุดกำหนดหัวเรื่องไว้ว่า
“ภาวะโลกร้อน” หากผู้ใช้กำหนดคำค้นว่า “โลกร้อน” ก็จะหาไม่เจอ เป็นต้น

     การค้นโดยใช้คำศัพท์แบบไม่ควบคุม (Uncontrolled Vocabulary)
นิยมเรียกกันว่าค้นแบบใช้ คำสำคัญ (Keyword)
ผู้ใช้สามารถกำหนดคำค้นได้ตามความต้องการโดยไม่ต้องคำนึงว่าจะตรงกับคำที่ห้องสมุดจัดไว้หรือไม่
คำสำคัญต้องอยู่ในรูปของคำศัพท์ หรือ วลี ไม่ใช่ประโยค
ตัวอย่าง ต้องการค้นเรื่อง
“ความรู้ทั่วไปเกี่ยวกับโรคไข้หวัดใหญ่“

การกำหนดคำค้น ต้องเป็นคำว่า “โรคไข้หวัดใหญ่“ หรือ “ไข้หวัดใหญ่“
                 
                     ข้อดีของการค้นจากคำศัพท์แบบไม่ควบคุม 
-ผู้ใช้สามารถกำหนดคำได้อย่างอิสระ สะดวกในการค้น
-สามารถกำหนดคำค้นได้จากคำศัพท์ใหม่ๆ ที่ยังไม่ได้มีการกำหนดคำศัพท์ควบคุมไว้
                
                      ข้อเสียของการค้นจากคำศัพท์แบบไม่ควบคุม 
-ผลการค้นได้เอกสารมากเกินความจำเป็น
-เอกสารบางอย่างที่ค้นไม่ได้ตรงกับความต้องการ
-ผลการค้นไม่เที่ยงตรงเท่ากับการใช้หัวเรื่อง แต่ค้นได้ง่ายกว่าและเยอะกว่า


เทคนิคการค้นฐานข้อมูลโดยใช้ตัวดำเนินการ
-การใช้บูลีน (Boolean)
-การค้นเป็นวลี (Phrase Search)
-การค้นแบบตัดปลาย (Truncation)
-การกำหนดค้นเฉพาะส่วน (Field Search)
-การจำกัดการค้น (Search Limit)

   การใช้บูลีน (Boolean)
ตรรกะบูลีน  ได้แก่ AND OR NOT NEAR
วิธีการใช้
AND   ใช้กำหนดค้นคำที่ต้องการให้ปรากฏทั้งหมด
OR  ใช้กำหนดค้นคำที่ต้องการให้ปรากฏทั้งหมด หรือคำใดคำหนึ่งก็ได้
NOT ใช้เมื่อต้องการตัดคำที่มีเนื้อหาที่ไม่ต้องการออก

NEAR ใช้ในการกำหนดระยะห่างของคำที่กำหนด

   การค้นเป็นวลี (Phrase Search)
การค้นเป็นวลี ก็เพื่อหลีกเลี่ยงการค้นที่คลาดเคลื่อนอันเนื่องมาจาก
คำนั้นเป็นชื่อบุคคล สถานที่ ชื่อหนังสือ หรือคำที่เขียนไม่ติดกัน
เช่น บารัค โอบามา ผลค้น อาจจะเป็น บารัค โอบามา หรือ มิเชล โอบามา หรือ … โอบามา
ดังนั้น ผู้ใช้ต้องใช้การค้นแบบวลีช่วยในการกำหนดคำค้นดังนี้
“บารัค โอบามา” เป็นต้น

   การค้นแบบตัดปลาย (Truncation)
เรียกอีกอย่างหนึ่งว่า การใช้ wildcard เป็นการกำหนดการค้นโดยใช้เครื่องหมายตัดปลายโดยกำหนดจากคำหลักแล้วใช้เครื่องหมายตัดปลายวางหลังตัวอักษรหรือระหว่างตัวอักษร เช่น
COMPUTER ใช้เครื่องหมายตัดปลายคือ COMPUT*
ผลที่ได้จะเป็นคำเหล่านี้  COMPUTE
                                        COMPUTER
                                        COMPUTERING
หรืออาจแทรกระหว่างตัวอักษรเช่น ORGANI*ATION

ผลที่ได้จะเป็น ORGANIZATION และ ORGANISATION

    โปรแกรมสืบค้นข้อมูล: SEARCH ENGINE
แหล่งรวบรวมข้อมูลที่ใหญ่ที่สุดในอินเทอร์เน็ตทำการเปรียบเทียบ คำที่กำหนดค้น กับดรรชนีคำ  ว่ามีความตรงกันมากน้อยเพียงใด นำผลค้นมาจัดลำดับความเกี่ยวข้องกับคำที่กำหนดค้นโดยแสดงปริมาณความเกี่ยวข้อง อาจแสดงเป็นร้อยละ หรือ จัดลำดับความสำคัญ หรือ วันที่

             ประเภทของ SEARCH ENGINE
1. จัดทำโดยโปรแกรมจัดเก็บ
         INDEX SEARCH  โปรแกรมค้นหาแบบดรรชนี
ผลการค้นหารูปภาพสำหรับ INDEX SEARCH
-อาจเรียกว่า keyword search engine
-ใช้Agent หรือ Spider หรือ Robot ในการตรวจสอบเว็บไซต์
-เข้าทำการสำรวจเว็บเพจที่มีในเครือข่ายหรือปรับปรุงเปลี่ยนแปลงข้อมูลใหม่ที่มีการเปิดดู
-นำรายการผลการสำรวจ เช่น ชื่อเรื่อง เนื้อหาโดยย่อ และ URL จัดเก็บในฐานข้อมูล 
Uniform Resource Locator
-สร้างดรรชนีของข้อมูลในหน้าเว็บเพจ
-ทำการเชื่อมโยงระหว่างดรรชนีและฐานข้อมูล

-จัดเก็บเว็บเพจไว้ในฐานข้อมูลของตัวเอง
                 
                      ข้อควรทราบเกี่ยวกับ Index Search
-ค้นได้เว็บไซต์ทันสมัย
-Spider ค้นหาเว็บเพจอยู่ตลอดเวลา
-นำมาทำดรรชนีค้นทันที
-ได้ผลค้นจำนวนมาก
-เว็บเพจที่ได้ต้องนำมาประเมินก่อนใช้ ถึงความน่าเชื่อถือ
-ผู้ใช้ควรทราบเกี่ยวกับวิธีการกำหนดค้น
- Boolean  Proximity  Truncate  (---)

         META SEARCH
ผลการค้นหารูปภาพสำหรับ META SEARCH
-ไม่มีฐานข้อมูลเป็นของตัวเอง
-สืบค้นข้อมูลจาก Search Engine อื่นๆ
-นำผลค้นที่ได้มาเรียงตามลำดับ
-สามารถเลือกสืบค้นพร้อมกันจากหลายๆ Search Engineในการค้นเพียงครั้งเดียวและหน้าจอเดียว

         

2. จัดทำโดยมนุษย์
Subject  Directory  Search
ผลการค้นหารูปภาพสำหรับ Subject  Directory  Search
-จัดกลุ่มเว็บเพจตามเนื้อหาที่ปรากฏ
-ใช้คนในการตรวจสอบ
-แบ่งเป็นกลุ่มเรื่องใหญ่ๆ
-แต่ละกลุ่มจะแบ่งเป็นเรื่องย่อยๆต่อไปเรื่อยๆ
-แสดงจำนวนรายการที่มีข้อมูล และแหล่งที่ปรากฏข้อมูล
                     
                      ข้อควรทราบเกี่ยวกับ Subject  Directory  Search
-ฐานข้อมูลมีจำนวนน้อย
-ได้ข้อมูลที่ตรงต่อความต้องการ
-มีการตรวจสอบเนื้อหาตรงกับหัวเรื่องโดยใช้มนุษย์
-การแบ่งเป็นกลุ่มจะแบ่งเป็นกลุ่มใหญ่ และแบ่งเป็นกลุ่มย่อยๆ
-การค้นต้องเปิดหลายหน้าต่าง จนถึงข้อมูลที่ต้องการ
-ข้อมูลที่ได้จะไม่ค่อยมีความทันสมัย


             Specific Search
ผลการค้นหารูปภาพสำหรับ Specific Search
-ใช้ค้นข้อมูลเฉพาะสาขาวิชา หรือข้อมูลเฉพาะด้าน
-ใช้ค้นหาแหล่งที่มี บริการฐานข้อมูล
-นิยมทำเป็นแบบนามานุกรมเหมือนแบบ Directory Search
-จัดทำโดยบรรณารักษ์ ผู้เชี่ยวชาญ หน่วยงานเฉพาะ
-วัตถุประสงค์เพื่อการค้นคว้าวิจัยเฉพาะด้าน





ไม่มีความคิดเห็น:

แสดงความคิดเห็น