บ้าน ข่าว & การวิเคราะห์ การเรียนรู้ของเครื่องคืออะไร

การเรียนรู้ของเครื่องคืออะไร

สารบัญ:

วีดีโอ: A day with Scandale - Harmonie Collection - Spring / Summer 2013 (กันยายน 2024)

วีดีโอ: A day with Scandale - Harmonie Collection - Spring / Summer 2013 (กันยายน 2024)
Anonim

ในเดือนธันวาคม 2560 DeepMind ห้องปฏิบัติการวิจัยที่ได้รับจาก Google ในปี 2014 ได้เปิดตัว AlphaZero โปรแกรมปัญญาประดิษฐ์ที่สามารถเอาชนะแชมป์โลกในเกมกระดานหลายเกม

สิ่งที่น่าสนใจคือ AlphaZero ได้รับคำแนะนำจากมนุษย์ถึงวิธีการเล่นเกม แต่ใช้การเรียนรู้ของเครื่องซึ่งเป็นสาขาหนึ่งของ AI ที่พัฒนาพฤติกรรมของมันผ่านประสบการณ์แทนที่จะเป็นคำสั่งที่ชัดเจน

ภายใน 24 ชั่วโมงอัลฟ่าซีโรประสบความสำเร็จเหนือมนุษย์ในการเล่นหมากรุกและเอาชนะโปรแกรมหมากรุกแชมป์โลกครั้งก่อน หลังจากนั้นไม่นานอัลกอริทึมการเรียนรู้ด้วยเครื่องจักรของอัลฟ่าซีโรก็เชี่ยวชาญ Shogi (หมากรุกญี่ปุ่น) และเกมกระดานจีน Go และมันก็เอาชนะ AlphaGo ได้ 100 เป็นศูนย์

การเรียนรู้ของเครื่องได้รับความนิยมในช่วงไม่กี่ปีที่ผ่านมาและกำลังช่วยให้คอมพิวเตอร์แก้ปัญหาที่เคยคิดว่าเป็นโดเมนพิเศษของความฉลาดของมนุษย์ และแม้ว่ามันจะยังห่างไกลจากวิสัยทัศน์ดั้งเดิมของปัญญาประดิษฐ์การเรียนรู้ของเครื่องทำให้เราใกล้ชิดกับเป้าหมายสูงสุดในการสร้างเครื่องคิด

ความแตกต่างระหว่างปัญญาประดิษฐ์กับการเรียนรู้ของเครื่องคืออะไร

วิธีการดั้งเดิมในการพัฒนาปัญญาประดิษฐ์นั้นเกี่ยวข้องกับการเข้ารหัสกฎและความรู้ทั้งหมดที่กำหนดพฤติกรรมของตัวแทน AI อย่างพิถีพิถัน เมื่อสร้าง AI ตามกฎนักพัฒนาจะต้องเขียนคำสั่งที่ระบุว่า AI ควรทำอย่างไรเพื่อตอบสนองต่อทุกสถานการณ์ที่เป็นไปได้ วิธีการที่ใช้กฎนี้เป็นที่รู้จักกันดีว่า AI แบบเก่า (GOFAI) หรือสัญลักษณ์ AI พยายามที่จะเลียนแบบการให้เหตุผลทางจิตใจและการเป็นตัวแทนของความรู้

ตัวอย่างที่สมบูรณ์แบบของสัญลักษณ์ AI คือ Stockfish เครื่องมือหมากรุกโอเพ่นซอร์สอันดับต้น ๆ มานานกว่า 10 ปีในการสร้าง โปรแกรมเมอร์และผู้เล่นหมากรุกหลายร้อยคนมีส่วนร่วมกับสต็อคฟิชและช่วยพัฒนาตรรกะของมันโดยการเขียนกฎของมัน - ตัวอย่างเช่นสิ่งที่ AI ควรทำเมื่อคู่ต่อสู้ย้ายอัศวินจาก B1 เป็น C3

แต่ AI ที่ยึดตามกฎมักจะแตกเมื่อต้องรับมือกับสถานการณ์ที่กฎนั้นซับซ้อนเกินไปและโดยนัย ยกตัวอย่างเช่นการจดจำคำพูดและวัตถุในภาพเป็นการดำเนินการขั้นสูงที่ไม่สามารถแสดงในกฎตรรกะได้

ซึ่งแตกต่างจาก AI ที่เป็นสัญลักษณ์โมเดล AI ของการเรียนรู้ด้วยเครื่องจักรได้รับการพัฒนาไม่ใช่โดยการเขียนกฎ แต่จากการรวบรวมตัวอย่าง ตัวอย่างเช่นในการสร้างเอ็นจิ้นหมากรุกที่เน้นการเรียนรู้ด้วยเครื่องผู้พัฒนาจะสร้างอัลกอริธึมพื้นฐานและจากนั้น "ฝึกอบรม" ด้วยข้อมูลจากเกมหมากรุกที่เล่นมาก่อนหน้านี้นับพัน ด้วยการวิเคราะห์ข้อมูล AI จะค้นพบรูปแบบทั่วไปที่กำหนดกลยุทธ์ในการชนะซึ่งสามารถใช้เพื่อเอาชนะคู่ต่อสู้ที่แท้จริง

ยิ่งมีการวิจารณ์เกี่ยวกับ AI มากเท่าไหร่เกมจะยิ่งคาดเดาได้ดีขึ้นระหว่างการเล่น นี่คือเหตุผลที่การเรียนรู้ของเครื่องถูกกำหนดเป็นโปรแกรมที่ปรับปรุงประสิทธิภาพด้วยประสบการณ์

การเรียนรู้ของเครื่องสามารถใช้ได้กับงานในโลกแห่งความเป็นจริงมากมายเช่นการจำแนกภาพการรู้จำเสียงการแนะนำเนื้อหาการตรวจจับการทุจริตและการประมวลผลภาษาธรรมชาติ

การเรียนรู้แบบมีผู้ควบคุมและไม่ได้รับการดูแล

นักพัฒนาเตรียมข้อมูลที่เกี่ยวข้องเพื่อสร้างแบบจำลองการเรียนรู้ของเครื่องทั้งนี้ขึ้นอยู่กับปัญหาที่พวกเขาต้องการแก้ไข ตัวอย่างเช่นหากพวกเขาต้องการใช้การเรียนรู้ของเครื่องเพื่อตรวจจับการทำธุรกรรมของธนาคารที่หลอกลวงผู้พัฒนาจะรวบรวมรายการธุรกรรมที่มีอยู่และติดป้ายกำกับไว้ด้วยผลลัพธ์ของพวกเขา (หลอกลวงหรือใช้งานได้) เมื่อพวกเขาป้อนข้อมูลไปยังอัลกอริทึมมันจะแยกธุรกรรมที่ฉ้อโกงและถูกต้องและค้นหาลักษณะทั่วไปภายในแต่ละชั้นเรียน กระบวนการของรูปแบบการฝึกอบรมที่มีข้อมูลกำกับประกอบเรียกว่า "การเรียนรู้แบบมีผู้ดูแล" และปัจจุบันเป็นรูปแบบที่โดดเด่นของการเรียนรู้ของเครื่อง

ที่เก็บข้อมูลออนไลน์จำนวนมากของข้อมูลที่มีเลเบลสำหรับงานที่แตกต่างกันมีอยู่แล้ว ตัวอย่างที่ได้รับความนิยม ได้แก่ ImageNet ซึ่งเป็นชุดข้อมูลโอเพ่นซอร์สมากกว่า 14 ล้านภาพที่มีป้ายกำกับและ MNIST ซึ่งเป็นชุดข้อมูลจำนวน 60, 000 หลักที่เขียนด้วยลายมือ ผู้พัฒนาเครื่องจักรเรียนรู้ยังใช้แพลตฟอร์มเช่น Mechanical Turk ของ Amazon ศูนย์กลางการจ้างงานออนไลน์แบบออนดีมานด์สำหรับการปฏิบัติงานด้านความรู้ความเข้าใจเช่นการติดฉลากรูปภาพและตัวอย่างเสียง และภาคที่เพิ่งเริ่มต้นของธุรกิจที่กำลังเติบโตมีความเชี่ยวชาญในการเพิ่มความคิดเห็น

แต่ไม่ใช่ว่าทุกปัญหาจะต้องมีข้อมูลกำกับ ปัญหาการเรียนรู้ของเครื่องบางอย่างสามารถแก้ไขได้ผ่าน "การเรียนรู้ที่ไม่สำรอง" ซึ่งคุณให้ข้อมูลแบบจำลอง AI ด้วยข้อมูลดิบและปล่อยให้มันเข้าใจด้วยตนเองว่ารูปแบบใดมีความเกี่ยวข้อง

การใช้การเรียนรู้แบบไม่มีผู้ดูแลร่วมกันคือการตรวจจับความผิดปกติ ตัวอย่างเช่นอัลกอริทึมการเรียนรู้ของเครื่องสามารถฝึกอบรมเกี่ยวกับข้อมูลดิบเครือข่ายการจราจรของอุปกรณ์ที่เชื่อมต่ออินเทอร์เน็ตเช่นตู้เย็นอัจฉริยะ หลังการฝึกอบรม AI จะสร้างพื้นฐานสำหรับอุปกรณ์และสามารถตั้งค่าสถานะพฤติกรรมที่ผิดปกติได้ หากอุปกรณ์นั้นติดมัลแวร์และเริ่มสื่อสารกับเซิร์ฟเวอร์ที่เป็นอันตรายโมเดลการเรียนรู้ของเครื่องจะสามารถตรวจจับได้เพราะปริมาณการใช้เครือข่ายจะแตกต่างจากพฤติกรรมปกติที่สังเกตได้ในระหว่างการฝึกอบรม

เสริมการเรียนรู้

ถึงตอนนี้คุณคงทราบแล้วว่าข้อมูลการฝึกอบรมที่มีคุณภาพมีบทบาทอย่างมากต่อประสิทธิภาพของโมเดลการเรียนรู้ของเครื่อง แต่ การเรียนรู้การเสริมแรง เป็นวิธีการเรียนรู้แบบเครื่องพิเศษที่ AI พัฒนาพฤติกรรมของมันโดยไม่ต้องใช้ข้อมูลก่อนหน้า

แบบจำลองการเรียนรู้การเสริมแรงเริ่มต้นด้วยกระดานชนวนที่สะอาด พวกเขาได้รับคำแนะนำเกี่ยวกับกฎพื้นฐานของสภาพแวดล้อมและงานที่ทำอยู่ ผ่านการลองผิดลองถูกพวกเขาเรียนรู้ที่จะปรับการกระทำให้เหมาะกับเป้าหมายของพวกเขา

AlphaZero ของ DeepMind เป็นตัวอย่างที่น่าสนใจของการเรียนรู้การเสริมแรง เมื่อเทียบกับโมเดลการเรียนรู้ด้วยเครื่องจักรอื่น ๆ ซึ่งต้องดูว่ามนุษย์เล่นหมากรุกและเรียนรู้จากพวกเขาอย่างไร AlphaZero เริ่มรู้เพียงการเคลื่อนไหวของชิ้นส่วนและเงื่อนไขการชนะของเกม หลังจากนั้นมันเล่นการแข่งขันนับล้านกับตัวเองเริ่มต้นด้วยการกระทำแบบสุ่มและค่อยๆพัฒนารูปแบบพฤติกรรม

การเรียนรู้การเสริมแรงเป็นประเด็นร้อนของการวิจัย เป็นเทคโนโลยีหลักที่ใช้ในการพัฒนาแบบจำลอง AI ที่สามารถเล่นเกมที่ซับซ้อนเช่น Dota 2 และ StarCraft 2 และยังใช้ในการแก้ปัญหาในชีวิตจริงเช่นการจัดการทรัพยากรศูนย์ข้อมูลและการสร้างหุ่นยนต์มือที่สามารถจัดการวัตถุที่มีความคล่องแคล่วเหมือนมนุษย์ .

การเรียนรู้อย่างลึกซึ้ง

การเรียนรู้ลึก เป็นอีกส่วนหนึ่งที่ได้รับความนิยมของการเรียนรู้ของเครื่อง มันใช้ โครงข่ายประสาทเทียมการ สร้างซอฟต์แวร์ที่ได้รับแรงบันดาลใจมาจากโครงสร้างทางชีววิทยาของสมองมนุษย์

เครือข่ายนิวรัลทำหน้าที่ประมวลผลข้อมูลที่ไม่มีโครงสร้างเช่นรูปภาพวิดีโอเสียงและข้อความที่ตัดตอนมาเป็นเวลานานเช่นบทความและรายงานการวิจัย ก่อนที่จะเรียนรู้อย่างลึกซึ้งผู้เชี่ยวชาญด้านการเรียนรู้ด้วยเครื่องจักรต้องใช้ความพยายามอย่างมากในการแยกฟีเจอร์จากรูปภาพและวิดีโอ โครงข่ายประสาทเทียมจะตรวจจับคุณสมบัติเหล่านั้นโดยอัตโนมัติโดยไม่ต้องใช้ความพยายามมากจากวิศวกรมนุษย์

การเรียนรู้อย่างลึกซึ้งนั้นอยู่เบื้องหลังเทคโนโลยี AI ที่ทันสมัยมากมายเช่นรถยนต์ที่ไม่มีคนขับระบบแปลขั้นสูงและเทคโนโลยีจดจำใบหน้าใน iPhone X ของคุณ

ข้อ จำกัด ของการเรียนรู้ของเครื่อง

ผู้คนมักสับสนในการเรียนรู้ของเครื่องด้วยปัญญาประดิษฐ์ระดับมนุษย์และแผนกการตลาดของ บริษัท บางแห่งจงใจใช้ข้อกำหนดแทนกัน แต่ในขณะที่การเรียนรู้ของเครื่องได้รับความก้าวหน้าอย่างมากในการแก้ปัญหาที่ซับซ้อน แต่ก็ยังห่างไกลจากการสร้างเครื่องคิดที่ผู้บุกเบิกของ AI จินตนาการไว้

นอกเหนือจากการเรียนรู้จากประสบการณ์สติปัญญาที่แท้จริงต้องการการใช้เหตุผลสามัญสำนึกและการคิดที่เป็นนามธรรม - พื้นที่ที่โมเดลการเรียนรู้ของเครื่องทำงานได้ไม่ดีนัก

ตัวอย่างเช่นในขณะที่การเรียนรู้ของเครื่องทำได้ดีในงานการจดจำรูปแบบที่ซับซ้อนเช่นการทำนายมะเร็งเต้านมล่วงหน้าห้าปี แต่มันก็ต้องดิ้นรนกับตรรกะที่ง่ายกว่าและงานให้เหตุผลเช่นการแก้ปัญหาคณิตศาสตร์ระดับมัธยม

การขาดการใช้เหตุผลในการเรียนรู้ของเครื่องทำให้เสียความรู้ทั่วไป ตัวอย่างเช่นเอเจนต์การเรียนรู้ของเครื่องที่สามารถเล่น Super Mario 3 อย่างมืออาชีพจะไม่ได้ครอบครองเกมแพลตฟอร์มอื่นเช่น Mega Man หรือแม้แต่ Super Mario รุ่นอื่น มันจะต้องได้รับการฝึกฝนตั้งแต่เริ่มต้น

หากปราศจากพลังในการดึงความรู้เชิงแนวคิดจากประสบการณ์โมเดลการเรียนรู้ด้วยเครื่องต้องใช้ข้อมูลการฝึกอบรมจำนวนมากเพื่อดำเนินการ น่าเสียดายที่หลายโดเมนขาดข้อมูลการฝึกอบรมที่เพียงพอหรือไม่มีเงินทุนที่จะได้รับเพิ่มเติม การเรียนรู้อย่างลึกซึ้งซึ่งขณะนี้เป็นรูปแบบที่แพร่หลายของการเรียนรู้ด้วยเครื่องก็มีปัญหาจากการอธิบายได้เช่นกัน: เครือข่ายประสาททำงานในรูปแบบที่ซับซ้อนและแม้แต่ผู้สร้างก็ต้องดิ้นรนเพื่อทำตามกระบวนการตัดสินใจ สิ่งนี้ทำให้เป็นการยากที่จะใช้พลังของเครือข่ายประสาทเทียมในการตั้งค่าที่มีข้อกำหนดทางกฎหมายในการอธิบายการตัดสินใจของ AI

โชคดีที่มีความพยายามในการเอาชนะข้อ จำกัด ของการเรียนรู้ของเครื่อง ตัวอย่างที่โดดเด่นอย่างหนึ่งคือการริเริ่มอย่างกว้างขวางโดย DARPA ซึ่งเป็นหน่วยงานวิจัยของกระทรวงกลาโหมเพื่อสร้างแบบจำลอง AI ที่อธิบายได้

  • ปัญญาประดิษฐ์ (AI) คืออะไร? ปัญญาประดิษฐ์ (AI) คืออะไร?
  • ดอลลาร์ AI ส่วนใหญ่ไปที่การเรียนรู้ของเครื่อง AI ดอลลาร์ส่วนใหญ่ไปที่การเรียนรู้ของเครื่อง
  • คุณต้องการเห็น AI ใช้อย่างไร คุณต้องการเห็น AI ใช้อย่างไร

โครงการอื่น ๆ มีวัตถุประสงค์เพื่อลดการพึ่งพาเครื่องเรียนรู้ของข้อมูลที่มีคำอธิบายประกอบและทำให้เทคโนโลยีสามารถเข้าถึงโดเมนที่มีข้อมูลการฝึกอบรมที่ จำกัด นักวิจัยที่ IBM และ MIT เพิ่งทำคำรุกในสนามโดยการรวม AI สัญลักษณ์กับเครือข่ายประสาท รุ่นไฮบริด AI ต้องการข้อมูลน้อยสำหรับการฝึกอบรมและสามารถให้คำอธิบายทีละขั้นตอนในการตัดสินใจ

ไม่ว่าวิวัฒนาการของการเรียนรู้ด้วยเครื่องจักรจะช่วยให้เราบรรลุเป้าหมายที่ไม่เคยมีมาก่อนในการสร้าง AI ระดับมนุษย์หรือไม่ แต่สิ่งที่เรารู้แน่นอนก็คือต้องขอบคุณความก้าวหน้าในการเรียนรู้ของเครื่องอุปกรณ์ที่วางอยู่บนโต๊ะทำงานของเราและการพักผ่อนในกระเป๋าของเรานั้นฉลาดขึ้นทุกวัน

การเรียนรู้ของเครื่องคืออะไร