บ้าน ธุรกิจ 7 เคล็ดลับเพื่อความสำเร็จในการเรียนรู้ของเครื่อง

7 เคล็ดลับเพื่อความสำเร็จในการเรียนรู้ของเครื่อง

2024

สารบัญ:

1. อย่าลืมโลจิสติกส์
2. ระวังข้อมูลของคุณ
3. อัลกอริธึมไม่ใช่กระสุนวิเศษ
4. ใช้ชุดเครื่องมือที่มีความหลากหลาย
5. การทดลองด้วยการเรียนรู้แบบไฮบริด
6. ราคาถูกไม่ได้หมายความว่าไม่ดี
7. อย่าเรียกมันว่า AI

วีดีโอ: Faith Evans feat. Stevie J – "A Minute" [Official Music Video] (ธันวาคม 2024)

ส่วนแรกของคู่มือธุรกิจเพื่อการเรียนรู้ของเครื่อง (ML) ของเราพังลงมาว่าแนวคิดเรื่องร่มของ ML นั้นได้รับการพัฒนาในสภาพแวดล้อมทางธุรกิจได้อย่างไร กลยุทธ์ที่มีประสิทธิภาพมากที่สุดจะพิจารณา ML ในเชิงปฏิบัติโดยใช้ทั้งการเรียนรู้เชิงลึกที่ซับซ้อนและใช้เทคนิค "การเรียนรู้ราคาถูก" ที่ใช้เวลาน้อยในการเพิ่มประสิทธิภาพกระบวนการขององค์กรและรับข้อมูลเชิงลึกทางธุรกิจที่จับต้องได้

เป้าหมายของการปรับใช้ ML ภายในแอปพลิเคชันธุรกิจของคุณคือการปรับปรุงผลประกอบการของคุณหรือกดความได้เปรียบในการแข่งขันของ บริษัท แต่ในโครงการขนาดใหญ่ขององค์กรของคุณการใช้เวลาและทรัพยากรให้คุ้มค่าที่สุดที่คุณลงทุนในกระบวนการนี้นอกเหนือไปจากอัลกอริธึม ผู้มีอำนาจตัดสินใจด้านไอทีในธุรกิจของคุณจำเป็นต้องตรวจสอบให้แน่ใจว่าทุกอย่างที่เกี่ยวกับการดำเนินการ ML ของคุณไม่ว่าจะเป็นข้อมูลและโลจิสติกส์ไปจนถึงวิธีการที่คุณมีส่วนร่วมกับผู้ใช้

Ted Dunning, Ph.D. เป็นหัวหน้าสถาปนิกแอปพลิเคชันที่ MapR ซึ่งเป็น บริษัท ซอฟต์แวร์ระดับองค์กรที่เสนอการแจกแจงข้อมูลขนาดใหญ่และเครื่องมือการจัดการข้อมูลต่างๆ Dunning ยังได้ประพันธ์หนังสือสองเล่มเกี่ยวกับสิ่งที่เขาอ้างถึงว่า "การเรียนรู้เครื่องปฏิบัติ" และพัฒนาเทคโนโลยี ML สำหรับ บริษัท หลายแห่งในช่วงหลายปีที่ผ่านมารวมถึงระบบตรวจจับการฉ้อโกง ID Analytics (ซื้อโดย LifeLock) และซอฟต์แวร์ Musicmatch Jukebox ซึ่งต่อมากลายเป็น Yahoo Music ปัจจุบันเขายังดำรงตำแหน่งรองประธานศูนย์บ่มเพาะมูลนิธิ Apache Software Foundation

การติดตามหนี้ดูพื้นที่ ML พัฒนาขึ้นในช่วงหลายทศวรรษและเรียนรู้มากมายเกี่ยวกับสิ่งที่ใช้ได้ผลและสิ่งที่ไม่ได้อยู่ในสภาพแวดล้อมทางธุรกิจที่ใช้งานได้จริง ด้านล่างการติดตามหนี้ออกเจ็ดแนวทางปฏิบัติที่ดีที่สุดที่ต้องปฏิบัติตามเมื่อพัฒนาโซลูชันทางธุรกิจที่ฝังรากใน ML

1. อย่าลืมโลจิสติกส์

ML ที่ประสบความสำเร็จไม่ได้เกี่ยวกับการเลือกเครื่องมือหรืออัลกอริทึมที่เหมาะสม Dunning กล่าวว่าคุณต้องเข้าใจด้วยว่าวิธีการใดที่เหมาะสมและออกแบบมาสำหรับสถานการณ์เฉพาะที่คุณกำลังพูดถึง ตัวอย่างเช่น Dunning พูดคุยเกี่ยวกับ ML ในแคมเปญการตลาดออนไลน์เมื่อเทียบกับสถานการณ์ที่ซับซ้อนกว่าเช่นอัลกอริธึมนำทางรถยนต์ที่เป็นอิสระ การใช้ทรัพยากรของคุณเพื่อการปรับปรุงอัลกอริทึมที่เพิ่มขึ้นนั้นคุ้มค่ากับปัญหาของรถ แต่ในสถานการณ์ทางการตลาดคุณจะเห็นผลตอบแทนที่ดีขึ้นจากการปรับระบบโลจิสติกส์ทั้งหมดให้ดีที่สุด

“ บ่อยครั้งที่ธุรกิจจะเป็นโลจิสติกส์ไม่ใช่การเรียนรู้ที่ให้คุณค่ากับคุณนั่นคือส่วนที่คุณควรใช้เวลาและทรัพยากรในการทำ” Dunning กล่าว "การปรับอัลกอริทึมจะทำให้คุณมีการปรับปรุงเล็ก ๆ น้อย ๆ แต่การปรับข้อมูลนั้น GUI และวิธีที่คุณฟังและการมีส่วนร่วมกับผู้ใช้ของคุณสามารถปรับปรุง 100 เปอร์เซ็นต์ได้อย่างง่ายดายการใช้เวลาปรับแต่งอัลกอริทึมนั้นคุ้มค่า ธุรกิจเป็นอย่างมากที่กำลังรับฟังผู้ใช้ของคุณ "

เพื่อแสดงให้เห็นถึงจุดนี้ Dunning อธิบายว่าครั้งหนึ่งเขาเคยสร้างแบบจำลองเพื่อระบุการฉ้อโกงแอปพลิเคชัน (เปิดบัญชีปลอมด้วยข้อมูลประจำตัวที่ถูกขโมย) ในฐานข้อมูลลูกค้าของ บริษัท แบบจำลองที่เขาสร้างขึ้นนั้นให้ผลลัพธ์ที่ยอดเยี่ยม แต่ Dunning สังเกตว่ามันให้น้ำหนักกับเพศของผู้สมัครเป็นอย่างมาก

มันกลับกลายเป็นว่าโลจิสติกถูกปิด วิธีการทำงานของแอปพลิเคชันผู้สมัครเพียงกรอกเพศของพวกเขาหลังจากที่พวกเขาได้กลายเป็นลูกค้าและได้ผ่านขั้นตอนการคัดกรองจำนวนมากเพื่อกรองผู้กระทำความผิด ดังนั้นด้วยการใช้ฟิลด์เพศโมเดล ML กำลังโกงโลจิสติกส์ของกระบวนการฉ้อโกงทั้งหมด นั่นไม่เกี่ยวกับอัลกอริธึมและทุกสิ่งที่เกี่ยวข้องกับวิธีที่ บริษัท ได้รับข้อมูลมาตั้งแต่แรก

2. ระวังข้อมูลของคุณ

การติดตามหนี้เต็มไปด้วยเกร็ดความรู้ที่จับใจ หลังจากเริ่มต้นด้วย "มันเป็นโลจิสติกส์ไม่ใช่การเรียนรู้" เขากล่าวอีกครึ่งหนึ่งของความคิดนั้นคือ "มันเป็นข้อมูลไม่ใช่อัลกอริทึม" ส่วนใหญ่ของการทำให้มั่นใจว่าอัลกอริทึม ML ของคุณให้ข้อมูลเชิงลึกที่มีค่าคือทำให้แน่ใจว่าคุณป้อนข้อมูลที่ถูกต้อง Dunning กล่าวว่าหากคุณไม่ได้รับผลลัพธ์ที่คุณกำลังมองหาบ่อยกว่านั้นเพราะคุณไม่ได้ใช้ข้อมูลที่ถูกต้อง

“ ทุกคนต่างก็เจ็บปวดและไม่ผูกพันกับอัลกอริธึมเฉพาะ แต่ทุกวันนี้เนื่องจากเครื่องมือออกมีทุกคนและแม่ของพวกเขาสามารถและขึ้นมาพร้อมกับอัลกอริธึมใหม่ ๆ ” Dunning กล่าว "ข้อมูลมีความสำคัญมากกว่าและจะช่วยยกระดับให้คุณได้มากกว่าการปรับแต่งอัลกอริทึมของคุณอย่างไม่มีที่สิ้นสุดหากคุณกำลังทำงานกับปัญหาที่ยากเช่นการรู้จำเสียงพูดหรือการมองเห็นด้วยคอมพิวเตอร์นั่นเป็นสิ่งหนึ่ง ในสถานการณ์ส่วนใหญ่คุณจะได้รับประโยชน์มากขึ้นจากการปรับข้อมูลที่คุณได้รับและการเปลี่ยนคำถาม "

นั่นคือสิ่งที่ Dunning ทำในช่วงกลางปี 2000 เมื่อสร้างเครื่องมือแนะนำวิดีโอที่ บริษัท แห่งหนึ่งชื่อ Veoh Networks ทีมทำงานเพื่อระบุคู่ของวิดีโอที่ผู้ใช้สร้างขึ้นซึ่งผู้คนคลิกมากกว่าที่คาดไว้ แต่อัลกอริทึมไม่ทำงาน พวกเขากำลังคิดในแง่ของเพลงที่ผู้ใช้รู้จักศิลปินและเพลงโปรดของพวกเขาตามชื่อ ดังนั้นพวกเขาจึงเปลี่ยนคำถามโดยปรับแต่งส่วนติดต่อผู้ใช้โดยไม่ต้องสัมผัสอัลกอริทึมเอง

“ ในวิดีโอที่ผู้ใช้สร้างขึ้นไม่มีใครรู้ว่าศิลปินและวิดีโอจำนวนมากมีชื่อเรื่องสแปมมากที่จะได้รับมุมมองที่มากขึ้นการปั่นจักรยานบนอัลกอริทึมการปรับแต่งจะไม่เคยให้ผลลัพธ์ที่ดีแก่เราเลย” Dunning กล่าว "สิ่งที่เราทำคือเปลี่ยนอินเทอร์เฟซผู้ใช้เพื่อส่งสัญญาณบีคอนทุก ๆ 10 วินาทีเราพบว่าถ้าเราใช้บีคอนแทนการคลิกเพื่อรับข้อมูลดิบของผู้แนะนำเราได้ผลลัพธ์ที่ยอดเยี่ยม การปรับปรุงการมีส่วนร่วมร้อยเปอร์เซ็นต์เนื่องจากข้อเสนอแนะโดยไม่มีการเปลี่ยนแปลงอัลกอริทึม "

3. อัลกอริธึมไม่ใช่กระสุนวิเศษ

การใช้งาน ML จะประสบความสำเร็จในการทดลองและข้อผิดพลาดอย่างต่อเนื่อง ไม่ว่าอัลกอริทึมของคุณจะดีแค่ไหนหากระบบของคุณมีปฏิสัมพันธ์กับมนุษย์ก็จะต้องมีการปรับเมื่อเวลาผ่านไป Dunning เน้นว่าธุรกิจควรทำการวัดประสิทธิผลโดยรวมของการนำไปใช้อย่างต่อเนื่องและระบุการเปลี่ยนแปลงและตัวแปรที่ทำให้ดีขึ้นและทำให้แย่ลง นี่อาจฟังดูเป็นคำพูดซ้ำซาก แต่ Dunning กล่าวถึงแม้จะฟังดูชัดเจน แต่มีคนน้อยมากที่ทำสิ่งนี้หรือทำได้ดี

“ ผู้คนจำนวนมากต้องการปรับใช้ระบบหรือดำเนินการบางอย่างและพวกเขาต้องการให้อัลกอริทึมของพวกเขาทำงานได้อย่างสมบูรณ์แบบตลอดกาล” Dunning กล่าว "ไม่มีอัลกอริธึมใดที่จะเป็นเวทย์มนตร์ bullet ไม่มีการออกแบบส่วนต่อประสานผู้ใช้จะคงอยู่ตลอดไปไม่มีวิธีการรวบรวมข้อมูลที่จะไม่ถูกแทนที่ทั้งหมดนี้สามารถเกิดขึ้นได้และธุรกิจจำเป็นต้องทำการวัดประเมินและประเมินอย่างรอบคอบ ระบบทำงาน "

4. ใช้ชุดเครื่องมือที่มีความหลากหลาย

มีเครื่องมือ ML หลายสิบแบบให้เลือกซึ่งส่วนมากคุณสามารถใช้ได้ฟรี คุณมีห้องสมุดกรอบโอเพนซอร์ซที่ได้รับความนิยมเช่น Caffe, H20, Shogun, TensorFlow และ Torch และ ML ML ในโครงการ Apache Software Foundation (ASF) หลายโครงการรวมถึง Mahout, Singa และ Spark จากนั้นมีตัวเลือกการสมัครสมาชิกรวมถึง Amazon Machine Learning, BigML และ Microsoft Azure Machine Learning Studio Microsoft ยังมีชุดเครื่องมือองค์ความรู้ฟรี

มีทรัพยากรมากมาย Dunning ได้พูดคุยกับธุรกิจมากมายนักวิทยาศาสตร์ด้านข้อมูลและผู้ปฏิบัติงาน ML และถามพวกเขาเสมอว่ามีกรอบและเครื่องมือที่แตกต่างกันเท่าใด โดยทั่วไปแล้ว Dunning กล่าวว่าส่วนใหญ่บอกว่าพวกเขาใช้เครื่องมืออย่างน้อย 5-7 เครื่องมือและบ่อยกว่านั้นมาก

“ คุณไม่สามารถติดตั้งเครื่องมือเดียวคุณจะต้องใช้หลายอย่างดังนั้นคุณควรสร้างระบบของคุณในแบบที่ไม่เชื่อเรื่องพระเจ้า” Dunning กล่าว "ใครก็ตามที่พยายามโน้มน้าวคุณว่าเครื่องมือนี้เป็นเครื่องมือเดียวที่คุณจะต้องมีคือขายสินค้าให้คุณ

“ มีบางอย่างอาจเกิดขึ้นในสัปดาห์หน้าที่ทำให้แอปเปิ้ลเกวียนหงุดหงิดและในอัตรานวัตกรรมที่เราเห็นอยู่นั้นจะเกิดขึ้นอีกอย่างน้อยห้าถึง 10 ปี” Dunning กล่าวต่อ "ดูตัวอย่างการเรียนรู้ราคาถูกซึ่งบางทีคุณอาจใช้ตัวแยกประเภทรูปภาพที่มีอยู่เพื่อวิเคราะห์รูปภาพในแคตตาล็อกอีกครั้งนั่นเป็นการเรียนรู้อย่างลึกซึ้งด้วยการมองเห็นของคอมพิวเตอร์ แต่มันมีเครื่องมือออกมาที่บรรจุมันหมดแล้ว เพื่อวัดประเมินและย้ายระหว่างเครื่องมือต่าง ๆ และโครงสร้างพื้นฐานของคุณจำเป็นต้องได้รับการต้อนรับ "

5. การทดลองด้วยการเรียนรู้แบบไฮบริด

Dunning กล่าวว่าคุณสามารถผสมผสานการเรียนรู้ราคาถูกและลึกเข้าด้วยกันเป็นสิ่งที่เป็นลูกผสมได้ ตัวอย่างเช่นถ้าคุณใช้โมเดลการมองเห็นของคอมพิวเตอร์ที่มีอยู่และสร้างเลเยอร์สองสามอันดับใหม่ที่มีการตัดสินใจคุณสามารถเลือกเฟรมเวิร์กที่มีอยู่สำหรับกรณีการใช้งานใหม่ทั้งหมด Dunning ชี้ไปที่การแข่งขัน Kaggle ซึ่งผู้เข้าแข่งขันทำอย่างนั้น พวกเขาใช้ชุดข้อมูลและเขียนอัลกอริธึมใหม่ด้านบนเพื่อช่วยให้คอมพิวเตอร์แยกแยะแมวจากสุนัข

"การแยกแยะแมวและสุนัขนั้นเป็นสิ่งที่ละเอียดอ่อนมากสำหรับอัลกอริธึม ML คิดเกี่ยวกับตรรกะ: แมวมีหูแหลม แต่เชพเพิร์ดเยอรมันทำเช่นนั้นสุนัขไม่มีจุดยกเว้นดัลเมเชียนเป็นต้น ในและของตัวเอง "Dunning กล่าว “ คนที่ชนะการพัฒนาระบบที่ทำสิ่งนี้ด้วยความแม่นยำถึง 99 เปอร์เซ็นต์ แต่ฉันก็ประทับใจกับคนที่เข้ามาอันดับสามแทนที่จะสร้างตั้งแต่เริ่มต้นเขาใช้โปรแกรมจดจำภาพที่มีอยู่จากงานที่แตกต่างออกไป ชั้นบนสุดและวางลักษณนามธรรมดาไว้ที่นั่นเขายกตัวอย่างและในไม่ช้ามันก็แม่นยำ 98 เปอร์เซ็นต์ในการแยกแมวจากสุนัขกระบวนการทั้งหมดใช้เวลาสามชั่วโมง "

6. ราคาถูกไม่ได้หมายความว่าไม่ดี

แม้จะมีความหมายแฝงแจ่มใส Dunning กล่าวว่าการเรียนราคาถูกไม่ได้หมายถึงการเรียนรู้ที่ไม่ดี ระยะเวลาที่คุณใช้ในการติดตั้ง ML นั้นไม่สัมพันธ์โดยตรงกับมูลค่าทางธุรกิจ เขากล่าวว่าคุณภาพที่สำคัญกว่านั้นคือการทำให้แน่ใจว่ากระบวนการนั้นสามารถทำซ้ำได้และเชื่อถือได้ หากธุรกิจสามารถบรรลุเป้าหมายดังกล่าวได้โดยไม่ต้องลงทุนทรัพยากรจนเกินความจำเป็นนั่นก็คือสิ่งที่ดีกว่า

“ ถูกไม่ได้หมายถึงไม่ดีถ้ามันใช้งานได้ผลถ้ามันถูกและใช้งานได้มันยิ่งใหญ่ แต่ความพยายามที่คุณสร้างมันไม่ได้กำหนดค่านั่นคือการเข้าใจผิดโดยรวม” Dunning กล่าว . "สิ่งที่กำหนดมูลค่าคือวิธีปรับปรุงธุรกิจหากการปรับปรุงผลกำไรหรือลดต้นทุนหรือปรับปรุงสถานการณ์การแข่งขันของคุณมันเป็นผลไม่ใช่ความพยายาม"

7. อย่าเรียกมันว่า AI

Dunning เน้นว่าเมื่อพูดถึงเทคนิคเหล่านี้ธุรกิจควรใช้คำศัพท์ที่แม่นยำ: ML วิสัยทัศน์คอมพิวเตอร์หรือการเรียนรู้อย่างลึกซึ้ง ทั้งหมดนี้มีแนวโน้มที่จะตกอยู่ภายใต้คำว่า "ปัญญาประดิษฐ์" แต่สำหรับ Dunning ความหมายของ AI ก็คือ "สิ่งที่ยังไม่ได้ผล"

"คำจำกัดความที่ดีที่สุดที่ฉันเคยได้ยินเกี่ยวกับ AI ก็คือมันเป็นสิ่งที่เรายังไม่สามารถอธิบายได้สิ่งที่เรายังไม่ได้คิดออกมา" Dunning กล่าว "ทุกครั้งที่เราทำงานอะไรคนอื่น ๆ ก็พูดว่า 'โอ้นั่นไม่ใช่ AI มันเป็นแค่ซอฟต์แวร์มันเป็นแค่เครื่องมือสร้างกฏมันเป็นแค่การถดถอยโลจิสติกส์' ก่อนที่เราจะเข้าใจบางสิ่งเราเรียกว่า AI หลังจากนั้นเราเรียกมันว่าอย่างอื่นเสมอในหลาย ๆ วิธี AI จะใช้เป็นคำสำหรับชายแดนต่อไปดีกว่าและใน AI จะมีพรมแดนถัดไปเสมอ AI คือ เราจะไปไหนไม่ใช่ที่เราไปถึงแล้ว "