08
Sep
2022

เราคุยกับวาฬได้ไหม?

โครงการที่มีความทะเยอทะยานกำลังพยายามตีความการคลิกของวาฬสเปิร์มด้วยปัญญาประดิษฐ์แล้วจึงพูดคุยกับพวกเขา

“ฉันไม่รู้อะไรมากเกี่ยวกับวาฬ ฉันไม่เคยเห็นปลาวาฬในชีวิตของฉัน” Michael Bronstein กล่าว นักวิทยาศาสตร์คอมพิวเตอร์ชาวอิสราเอล ที่กำลังสอนอยู่ที่ Imperial College London ประเทศอังกฤษ อาจดูเหมือนไม่ใช่ผู้สมัครในอุดมคติสำหรับโครงการที่เกี่ยวข้องกับการสื่อสารของวาฬสเปิร์ม แต่ทักษะของเขาในฐานะผู้เชี่ยวชาญด้านแมชชีนเลิร์นนิงอาจเป็นกุญแจสู่ความทะเยอทะยานที่เริ่มต้นอย่างเป็นทางการในเดือนมีนาคม 2020: กลุ่มนักวิทยาศาสตร์สหวิทยาการต้องการใช้ปัญญาประดิษฐ์ (AI) เพื่อถอดรหัสภาษาของสัตว์เลี้ยงลูกด้วยนมในทะเลเหล่านี้ หากโครงการ CETI (สำหรับโครงการ Cetacean Translation Initiative) สำเร็จ จะเป็นครั้งแรกที่เราเข้าใจจริงๆ ว่าสัตว์กำลังพูดถึงอะไร และบางทีเราอาจจะได้คุยกับพวกมันด้วยซ้ำ

เริ่มขึ้นในปี 2560 เมื่อกลุ่มนักวิทยาศาสตร์นานาชาติใช้เวลาหนึ่งปีร่วมกันที่มหาวิทยาลัยฮาร์วาร์ดในเมืองเคมบริดจ์ รัฐแมสซาชูเซตส์ ที่ Radcliffe Fellowship ซึ่งเป็นโครงการที่ให้คำมั่นสัญญาว่า “โอกาสที่จะก้าวออกจากงานประจำ” อยู่มาวันหนึ่ง Shafi Goldwasser นักวิทยาศาสตร์คอมพิวเตอร์และผู้เชี่ยวชาญด้านการเข้ารหัสจากอิสราเอล มาที่สำนักงานของ David Gruber นักชีววิทยาทางทะเลที่ City University of New York Goldwasser ซึ่งเพิ่งได้รับการเสนอชื่อให้เป็นผู้อำนวยการคนใหม่ของ Simons Institute for the Theory of Computing แห่งมหาวิทยาลัยแคลิฟอร์เนีย เบิร์กลีย์ เคยได้ยินเสียงคลิกหลายชุดที่เตือนให้เธอนึกถึงเสียงที่วงจรอิเล็กทรอนิกส์ผิดปกติสร้างขึ้น หรือรหัสมอร์ส . นั่นเป็นวิธีที่วาฬสเปิร์มคุยกัน Gruber บอกกับเธอ “ฉันพูดว่า, ‘บางทีเราควรจะทำโครงการที่เรากำลังแปลเสียงวาฬเป็นสิ่งที่มนุษย์สามารถเข้าใจได้’” โกลด์วาสเซอร์เล่า “ฉันพูดจริง ๆ ว่ามันเป็นความคิดในภายหลัง ฉันไม่เคยคิดเลยว่าเขาจะจริงจังกับฉัน”

แต่การคบหาเป็นโอกาสที่จะนำความคิดที่ห่างไกลออกไปอย่างจริงจัง ในงานเลี้ยงอาหารค่ำ พวกเขานำเสนอแนวคิดนี้แก่ Bronstein ซึ่งกำลังติดตามความก้าวหน้าล่าสุดในการประมวลผลภาษาธรรมชาติ (NLP) ซึ่งเป็นสาขาหนึ่งของ AI ที่เกี่ยวข้องกับการวิเคราะห์อัตโนมัติของคำพูดที่เป็นลายลักษณ์อักษรและการพูด จนถึงตอนนี้ เป็นเพียงภาษามนุษย์ Bronstein เชื่อมั่นว่า codas ตามที่เรียกกันโดยสังเขปของวาฬสเปิร์มมีโครงสร้างที่ยืมพวกเขาไปสู่การวิเคราะห์ประเภทนี้ โชคดีที่ Gruber รู้จักนักชีววิทยาชื่อ Shane Gero ซึ่งเคยบันทึกโคดาวาฬสเปิร์มจำนวนมากในน่านน้ำรอบเกาะโดมินิกาในแคริบเบียนมาตั้งแต่ปี 2548 Bronstein ได้นำอัลกอริธึมการเรียนรู้ด้วยเครื่องมาใช้กับข้อมูล “ดูเหมือนว่าพวกเขาจะทำงานได้ดี อย่างน้อยกับงานที่ค่อนข้างง่าย” เขากล่าว แต่นี่เป็นเพียงการพิสูจน์แนวคิดเท่านั้น สำหรับการวิเคราะห์เชิงลึก

แต่สัตว์มีภาษาหรือไม่? คำถามนี้เป็นที่ถกเถียงกันในหมู่นักวิทยาศาสตร์มาเป็นเวลานาน สำหรับหลาย ๆ คน ภาษาเป็นหนึ่งในปราการสุดท้ายของการผูกขาดของมนุษย์ สัตว์สื่อสารได้ แต่พวกมันไม่พูด นักชีววิทยาชาวออสเตรีย คอนราด ลอเรนซ์ หนึ่งในผู้บุกเบิกวิทยาศาสตร์พฤติกรรมสัตว์ ผู้เขียนหนังสือเกี่ยวกับการสื่อสารของเขาเองกับสัตว์ในหนังสือKing Solomon’s Ring ในปี 1949 กล่าว “สัตว์ไม่มีภาษาในความหมายที่แท้จริงของคำ” ลอเรนซ์เขียน

“ฉันคิดว่าเรายังไม่ได้ดูอย่างใกล้ชิดเพียงพอ” Karsten Brensing นักชีววิทยาทางทะเลชาวเยอรมันผู้เขียนหนังสือเกี่ยวกับการสื่อสารกับสัตว์หลายเล่มโต้แย้ง เบรนซิงเชื่อว่าคำพูดของสัตว์หลายชนิดสามารถเรียกได้ว่าเป็นภาษา นี่ไม่ใช่แค่การเห่าของสุนัขเท่านั้น แต่ยังต้องปฏิบัติตามเงื่อนไขหลายประการ “ประการแรก ภาษามีความหมาย นั่นหมายความว่าการเปล่งเสียงบางอย่างมีความหมายคงที่ที่ไม่เปลี่ยนแปลง” ตัวอย่างเช่น นกไซบีเรียนเจย์ชนิดหนึ่ง มีคำศัพท์ประมาณ 25 ครั้ง ซึ่งบางคำมีความหมายตายตัว

เงื่อนไขที่สองคือไวยากรณ์: กฎสำหรับการสร้างประโยค เป็นเวลานานที่นักวิทยาศาสตร์เชื่อว่าการสื่อสารกับสัตว์ไม่มีโครงสร้างประโยค แต่ในปี 2559 นักวิจัยชาวญี่ปุ่นได้ตีพิมพ์ผลการศึกษาในNature Communicationsเกี่ยวกับการเปล่งเสียงของหัวนมที่ยอดเยี่ยม ในบางสถานการณ์ นกจะรวมการโทรสองครั้งที่แตกต่างกันเพื่อเตือนกันและกันเมื่อผู้ล่าเข้าใกล้ พวกเขายังตอบสนองเมื่อนักวิจัยเล่นลำดับนี้กับพวกเขา อย่างไรก็ตาม เมื่อคำสั่งโทรกลับกลายเป็นว่า นกตอบสนองน้อยกว่ามาก “นั่นคือไวยากรณ์” เบรนซิงกล่าว

เกณฑ์ที่สาม: คุณจะไม่เรียกการเปล่งเสียงของสัตว์สายพันธุ์หนึ่งเป็นภาษาหากพวกมันมีมาแต่กำเนิดโดยสมบูรณ์ Lorenz เชื่อว่าสัตว์ต่างๆ เกิดมาพร้อมกับการแสดงละครและไม่ได้เรียนรู้อะไรมากมายในช่วงชีวิตของพวกเขา “การแสดงออกทางอารมณ์ของสัตว์ทั้งหมด เช่น โน้ต ‘เกีย’ และ ‘เคียว’ ของแม่ไก่ ดังนั้น จึงเทียบไม่ได้กับภาษาพูดของเรา แต่เฉพาะกับการแสดงออกเหล่านั้น เช่น หาว ย่นคิ้ว และยิ้ม ซึ่งแสดงออก โดยไม่รู้ตัวว่าเป็นการกระทำโดยธรรมชาติ” ลอเรนซ์เขียน

สัตว์หลายชนิดได้รับการพิสูจน์แล้วว่าเป็นการเรียนรู้เสียง—ได้คำศัพท์ใหม่ พัฒนาภาษาถิ่น ระบุชื่อกันและกัน นกบางตัวเรียนรู้ที่จะเลียนแบบเสียงเรียกเข้าของโทรศัพท์มือถือ โลมาได้รับเสียงนกหวีดแต่ละตัวซึ่งพวกมันใช้เป็นตัวระบุสำหรับพวกมันเอง เกือบจะเหมือนกับชื่อ

การคลิกของวาฬสเปิร์มเป็นตัวเลือกในอุดมคติสำหรับการพยายามถอดรหัสความหมายของพวกมัน—ไม่เพียงเพราะไม่เหมือนกับเสียงต่อเนื่องที่วาฬสายพันธุ์อื่นๆ ผลิตขึ้น พวกมันสามารถแปลเป็นเสียงหนึ่งและศูนย์ได้อย่างง่ายดาย สัตว์เหล่านี้ดำดิ่งลงไปในมหาสมุทรที่ลึกที่สุดและสื่อสารกันในระยะไกล ดังนั้นพวกมันจึงไม่สามารถใช้ภาษากายและการแสดงออกทางสีหน้า ซึ่งเป็นวิธีการสื่อสารที่สำคัญสำหรับสัตว์อื่นๆ “มันเป็นเรื่องจริงที่จะสรุปว่าการสื่อสารของวาฬนั้นเน้นเสียงเป็นหลัก” บรอนสไตน์กล่าว วาฬสเปิร์มมีสมองที่ใหญ่ที่สุดในอาณาจักรสัตว์ ใหญ่กว่าเราถึงหกเท่า เมื่อสัตว์สองตัวนี้คุยกันเป็นเวลานาน เราไม่ควรสงสัยว่าพวกเขามีอะไรจะพูดกันหรือไม่? พวกเขาให้คำแนะนำซึ่งกันและกันเกี่ยวกับแหล่งตกปลาที่ดีที่สุดหรือไม่? แม่วาฬแลกเปลี่ยนเรื่องราวเกี่ยวกับการเลี้ยงลูกเหมือนลูกมนุษย์หรือไม่? นักวิจัยของ CETI กล่าว

การเรียนรู้ภาษาที่ไม่รู้จักจะง่ายกว่าถ้ามีบางอย่างเช่น Rosetta Stone ที่มีชื่อเสียง stele นี้ซึ่งค้นพบในปี 1799 มีข้อความเดียวกันในสามภาษาและเป็นกุญแจสำคัญในการถอดรหัสอักษรอียิปต์โบราณ แน่นอนว่าไม่มีสิ่งดังกล่าวสำหรับอาณาจักรสัตว์ เราไม่มีพจนานุกรมวาฬมนุษย์หรือหนังสือที่มีกฎไวยากรณ์ของภาษาวาฬสเปิร์ม

แต่มีวิธีรอบที่ แน่นอน เด็กๆ จะเรียนรู้ภาษาแม่โดยไม่ต้องใช้เครื่องมือเหล่านี้ เพียงแค่สังเกตภาษาที่พูดรอบตัวพวกเขา นักวิจัยสรุปว่าการเรียนรู้ประเภทนี้โดยพื้นฐานแล้วเป็นสถิติ: เด็กจำได้ว่าคำว่าdogนั้นพูดบ่อยมากเมื่อสัตว์ขนฟูนั้นเข้ามาในห้อง คำบางคำมักใช้ร่วมกับคำบางคำ ลำดับคำเฉพาะ มีโอกาสมากกว่าอีก ในช่วง 10 ปีที่ผ่านมา วิธีการเรียนรู้ด้วยเครื่องได้เลียนแบบการเรียนรู้ประเภทนี้ นักวิจัยได้ป้อนเครือข่ายประสาทขนาดใหญ่ด้วยข้อมูลภาษาจำนวนมาก และเครือข่ายเหล่านั้นสามารถค้นหาโครงสร้างในภาษาต่างๆ จากการสังเกตทางสถิติ โดยไม่ต้องมีการบอกอะไรเกี่ยวกับเนื้อหา

ตัวอย่างหนึ่งคือโมเดลภาษาที่เรียกว่า ซึ่งเป็นที่รู้จักมากที่สุดคือ GPT-3 ซึ่งพัฒนาโดยบริษัท OpenAI โมเดลภาษาคือกลไกการเติมคำ ตัวอย่างเช่น GPT-3 ให้จุดเริ่มต้นของประโยคและเติมคำต่อคำ ในลักษณะเดียวกับคำแนะนำที่สมาร์ทโฟนทำเมื่อเราพิมพ์ข้อความ ซึ่งซับซ้อนกว่ามาก ด้วยการประมวลผลข้อความจำนวนมากทางสถิติที่ดึงมาจากอินเทอร์เน็ต โมเดลภาษาไม่เพียงแต่รู้ว่าคำใดปรากฏร่วมกันบ่อยๆ แต่ยังเรียนรู้กฎของการแต่งประโยคด้วย พวกเขาสร้างประโยคที่ฟังดูถูกต้องและมักเป็นประโยคที่มีคุณภาพดีเยี่ยม พวกเขาสามารถเขียนบทความข่าวปลอมในหัวข้อที่กำหนด สรุปข้อความทางกฎหมายที่ซับซ้อนด้วยคำศัพท์ง่ายๆ และแม้กระทั่งการแปลระหว่างสองภาษา

ความสำเร็จเหล่านี้ต้องแลกมาด้วยราคา: ต้องใช้ข้อมูลจำนวนมาก โปรแกรมเมอร์ได้ฝึกฝนโครงข่ายประสาทเทียมของ GPT-3 ด้วยคำศัพท์ประมาณ 175 พันล้านคำ ในการเปรียบเทียบ โครงการ Dominica Sperm Whale ของ Gero ได้รวบรวม codas ของวาฬสเปิร์มน้อยกว่า 100,000 ตัว งานแรกของโครงการวิจัยใหม่คือการขยายคอลเล็กชันนั้นอย่างมากมาย โดยมีเป้าหมายเพื่อรวบรวมคำศัพท์สี่พันล้านคำ แม้ว่าจะยังไม่มีใครรู้ว่า “คำ” ในภาษาวาฬสเปิร์มคืออะไร

หากแนวคิดของ Bronstein ได้ผล การพัฒนาระบบที่คล้ายคลึงกับแบบจำลองภาษามนุษย์ที่สร้างคำพูดของวาฬที่ถูกต้องตามหลักไวยากรณ์ก็ค่อนข้างจะเป็นไปได้ ขั้นตอนต่อไปจะเป็นแชทบอทแบบโต้ตอบที่พยายามโต้ตอบกับวาฬที่มีชีวิตอยู่อย่างอิสระ แน่นอน วันนี้ไม่มีใครสามารถพูดได้ว่าสัตว์จะยอมรับมันเป็นคู่สนทนาหรือไม่ “บางทีพวกเขาอาจจะตอบว่า ‘หยุดพูดเรื่องไร้สาระได้แล้ว!’” บรอนสไตน์กล่าว

แต่แม้ว่าแนวคิดจะได้ผล แต่ข้อเสียของรูปแบบภาษาทั้งหมดก็คือพวกเขาไม่รู้อะไรเลยเกี่ยวกับเนื้อหาของภาษาที่พวกเขากำลังสนทนา คงจะเป็นเรื่องน่าขันหากนักวิจัยสร้างบอทที่สามารถสนทนากับวาฬได้คล่อง แต่แล้วพวกเขาก็ไม่เข้าใจคำใด ๆ นั่นเป็นเหตุผลที่พวกเขาต้องการใส่คำอธิบายประกอบการบันทึกเสียงด้วยข้อมูลเกี่ยวกับพฤติกรรมของวาฬตั้งแต่เริ่มต้น—สัตว์อยู่ที่ไหน ใครพูดกับใคร มีปฏิกิริยาอย่างไร? ความท้าทายคือการหาวิธีอัตโนมัติในการทำหมายเหตุประกอบเป็นล้านๆ รายการเป็นอย่างน้อย

ยังต้องพัฒนาเทคโนโลยีอีกมาก—เซ็นเซอร์เพื่อบันทึกวาฬแต่ละตัวและตรวจสอบตำแหน่งของพวกมัน สิ่งเหล่านี้จำเป็นสำหรับการกำหนดเสียงแต่ละเสียงให้กับสัตว์ตัวใดตัวหนึ่งอย่างชัดเจน โครงการ CETI ประสบความสำเร็จในการใช้เงินทุนเป็นเวลาห้าปีจากโครงการ Audacious Project ที่ดำเนินการโดย TED ซึ่งเป็นองค์กรจัดการประชุม องค์กรหลายแห่งเป็นส่วนหนึ่งของโครงการนี้ รวมถึง National Geographic Society และ Computer Science and Artificial Intelligence Laboratory ที่สถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT)

นักวิจัยของ CETI ไม่ใช่คนแรกที่มีแนวคิดในการใช้เทคนิคการเรียนรู้ด้วยเครื่องกับภาษาสัตว์ Aza Raskin อดีตนักฟิสิกส์ นักออกแบบ และผู้ประกอบการที่หันมาวิจารณ์เทคโนโลยี มีแนวคิดที่คล้ายกันในปี 2013 เมื่อเขาได้ยินเกี่ยวกับภาษาที่ซับซ้อนของลิงแอฟริกันเจลาดา เราสามารถใช้เทคโนโลยี NLP ที่พัฒนาขึ้นเพื่อประมวลผลภาษามนุษย์กับเสียงร้องของสัตว์ได้หรือไม่? เขาช่วยพบโครงการ Earth Species โดยมีจุดประสงค์เพื่อทำเช่นนั้น ในเวลานั้น เทคโนโลยียังอยู่ในช่วงเริ่มต้น ต้องใช้เวลาอีกสี่ปีก่อนที่จะพัฒนาเป็นวิธีการเรียนรู้ด้วยตนเองสำหรับการแปลอัตโนมัติระหว่างภาษาต่างๆ เทคนิคการฝังคำทำให้คำทั้งหมดของภาษากลายเป็นกาแลคซีหลายมิติซึ่งคำที่มักใช้ร่วมกันอยู่ใกล้กัน และการเชื่อมต่อเหล่านั้นจะแสดงด้วยเส้น ตัวอย่างเช่น “ราชา” เกี่ยวข้องกับ “ผู้ชาย” ขณะที่ “ราชินี” เกี่ยวข้องกับ “ผู้หญิง”

ปรากฎว่าแผนที่ของภาษามนุษย์สองภาษาสามารถสร้างขึ้นมาพร้อมกันได้ ถึงแม้ว่าไม่ใช่ทุกคำจากภาษาหนึ่งจะมีคำที่เหมือนกันในอีกภาษาหนึ่ง วันนี้ เทคนิคนี้ช่วยให้สามารถแปลระหว่างภาษามนุษย์สองภาษาในข้อความที่เป็นลายลักษณ์อักษร และในไม่ช้าก็สามารถใช้กับการบันทึกเสียงโดยไม่มีข้อความได้

แต่เป็นไปได้ไหมที่เราจะสามารถซ้อนแผนที่ภาษามนุษย์และภาษาสัตว์ได้? Raskin เชื่อมั่นว่าสิ่งนี้เป็นไปได้ อย่างน้อยก็ในหลักการ “เกือบจะแน่นอนว่ามีชุดประสบการณ์ร่วมกัน โดยเฉพาะอย่างยิ่งกับสัตว์เลี้ยงลูกด้วยนมอื่นๆ พวกเขาต้องหายใจ ต้องกิน พวกเขาทำให้ลูกของพวกเขาเสียใจหลังจากที่พวกเขาตาย” เขากล่าว ในขณะเดียวกัน Raskin เชื่อว่าจะมีพื้นที่จำนวนมากที่ไม่เข้ากับแผนที่ “ฉันไม่รู้ว่าอะไรจะน่าสนใจไปกว่านั้น—ส่วนที่เราแปลได้โดยตรง หรือส่วนที่ไม่มีอะไรที่แปลได้โดยตรงจากประสบการณ์ของมนุษย์” เมื่อสัตว์พูดเพื่อตัวเองและเราสามารถฟังได้ Raskin กล่าว เราสามารถมี “ช่วงเวลาทางวัฒนธรรมที่เปลี่ยนแปลงได้อย่างแท้จริง”

หน้าแรก

Share

You may also like...

Leave a Reply

Your email address will not be published.