บ้าน Appscout วิธีการใช้ข้อมูลขนาดใหญ่กับโลกแห่งความจริง

วิธีการใช้ข้อมูลขนาดใหญ่กับโลกแห่งความจริง

วีดีโอ: A day with Scandale - Harmonie Collection - Spring / Summer 2013 (กันยายน 2024)

วีดีโอ: A day with Scandale - Harmonie Collection - Spring / Summer 2013 (กันยายน 2024)
Anonim

ใน Fast Forward ฉบับนี้ฉันได้พูดคุยกับ Hicham Oudghiri ซีอีโอและผู้ร่วมก่อตั้ง Enigma บริษัท ที่เชี่ยวชาญในการรวบรวมและทำความเข้าใจกับชุดข้อมูลขนาดใหญ่ Enigma เป็น บริษัท ด้านการจัดการข้อมูลและข่าวกรองสำหรับลูกค้าเอกชน แต่อาจเป็นที่รู้จักกันดีที่สุดสำหรับ Enigma Public ซึ่งเป็นกลุ่มของชุดข้อมูลที่สามารถเข้าถึงได้และเข้าถึงได้โดยสาธารณชนซึ่งรวมทุกอย่างตั้งแต่เงินเดือนของพนักงานสำนักงาน White House ไปจนถึงการตรวจสอบร้านอาหารนิวยอร์ก เราพูดถึงพลังของข้อมูลขนาดใหญ่ขีด จำกัด ของความเป็นส่วนตัวของผู้บริโภคและอนาคตของโลกที่ขับเคลื่อนด้วยข้อมูลของเรา

ทำไมคุณไม่อธิบายให้ฉันฟังนิดหน่อยว่าการเป็น บริษัท เปิดข้อมูลหมายถึงอะไรในวันนี้

อย่างแน่นอน เราเริ่มจากการรวบรวมข้อมูลสาธารณะจำนวนมากทุกที่ที่เราสามารถหาได้โดยมีภารกิจที่จะพยายามเชื่อมต่อข้อเท็จจริงที่แตกต่างกันมากเกี่ยวกับโลก เราตระหนักว่าในกระบวนการนี้การเข้าถึงข้อมูลที่สำคัญนี้ได้รับความเสียหายรูปแบบนี้สะท้อนถึงข้อมูลของตัวเองของประชาชนสำหรับแผนการรายงานข้อมูลสาธารณะและเอกชนเช่นในสภาพแวดล้อมด้านกฎระเบียบ จริงๆแล้วสิ่งที่เรานำมาคือความคิดเกี่ยวกับข้อมูลแบบเปิดที่เป็นแบบจำลองการดำเนินงานทุกที่ที่เราไป

จุดที่น่าสนใจของเราในวันนี้คือการปลูกฝังแหล่งเก็บข้อมูลขนาดใหญ่ของข้อมูลสาธารณะและนำมาใช้ในสภาพแวดล้อมปัญหาที่เกิดขึ้นจริงบ่อยครั้งหลังไฟร์วอลล์สำหรับองค์กร แม้ว่าเราจะรวบรวมและแจกจ่ายข้อมูลจำนวนมหาศาล แต่เราพบว่าการก้าวไปข้างหน้าในการตีความข้อมูลนั้นจริง ๆ และเชื่อมโยงไปยังข้อมูลส่วนตัวจริง ๆ แล้วช่วยลดผลกระทบของปัญหาบางอย่างที่เราต้องการแก้ไข

ผู้คนได้ยินเกี่ยวกับชุดข้อมูลแบบเปิดชุดข้อมูลสาธารณะชุดข้อมูลส่วนตัว ชุดข้อมูลชนิดใดที่เรากำลังพูดถึงอยู่ที่นี่

เรากำลังพูดถึงข้อมูลแหล่งข้อมูลทางการสิ่งต่าง ๆ ที่หน่วยงานของรัฐจะเผยแพร่สิ่งที่หน่วยงานระหว่างประเทศจะเผยแพร่ทุกอย่างที่แตกต่างกันตั้งแต่บันทึกการจดทะเบียนของ บริษัท และการประเมินทรัพย์สินไปจนถึงการขอวีซ่า H-1B หรือการขนส่งตู้สินค้า แน่นอนว่าไม่ต้องพูดถึงเรื่องต่าง ๆ เช่นข้อมูล LinkedIn ซึ่งเป็นหัวข้ออภิปรายขนาดใหญ่เมื่อเร็ว ๆ นี้ว่าเป็นชุดข้อมูลสาธารณะหรือไม่ เมื่อเร็ว ๆ นี้มีคดีที่มีการโต้แย้งกันมากมาย

แต่เรากำลังพูดถึงส่วนใหญ่เกี่ยวกับแหล่งข้อมูลอย่างเป็นทางการซึ่งมีคำสั่งและการอนุมัติทางกฎหมายอย่างเป็นทางการที่จะนำสิ่งนี้เข้าสู่สาธารณสมบัติส่วนใหญ่เพื่อเพิ่มความโปร่งใสในระบบเศรษฐกิจและการค้า มันสำคัญมากที่เราจะต้องรู้เช่นจากมุมมองด้านความรับผิดชอบสิ่งที่รัฐบาลของเราใช้กับ บริษัท เอกชนหลายแห่งหรือจากมุมมองด้านความรับผิดชอบสิ่งที่การกระจายของวีซ่าจะไปถึง บริษัท ต่างๆ ข้อมูลนั้นจะถูกรวบรวมโดยรัฐบาลเพื่อวัตถุประสงค์ทางเลือกเช่นการรายงานการวางแผนการจัดสรรทรัพยากรและมอบคืนสู่สาธารณะเพื่อผลประโยชน์รองและมักจะเป็นประโยชน์ในระดับอุดมศึกษา ตัวอย่างที่นิยมมากที่สุดเป็นเพียงข้อมูลสภาพอากาศใช่ไหม

ข้อมูลสภาพอากาศทั้งหมดที่เรารวบรวมมาจากแหล่งข้อมูลอย่างเป็นทางการหรือ GPS เป็นเทคโนโลยี

ดังนั้นคุณจึงนำชุดข้อมูลสาธารณะเหล่านั้นมารวมกับชุดข้อมูลส่วนตัวที่ บริษัท จะให้คุณโดยเฉพาะและเห็นข้อมูลเชิงลึกระหว่างการรวมสองชุดเข้าด้วยกัน

ใช่บ่อยมาก ลองนึกถึงกรณีการใช้งานแบบบัญญัติซึ่งคุณกำลังพยายามทำสิ่งต่าง ๆ เช่นคิดออกว่า บริษัท นั้นเป็นของจริงหรือไม่ หากเป็น บริษัท เล็ก ๆ ใช้พูดร้านอาหารหรือธุรกิจขนาดเล็ก บ่อยครั้งที่รูปแบบที่พวกเขามีอยู่นั้นบางมาก แต่ถ้าคุณต้องดูสิ่งต่าง ๆ เช่นใบขับขี่ของพวกเขาหรือแม้กระทั่งการตรวจของกระทรวงแรงงานหรือการตรวจสุขภาพบันทึกคุณจะได้ภาพที่ละเอียดมากขึ้นว่าพวกเขาเป็นใคร

บ่อยครั้งที่ช่วยให้ บริษัท เหล่านี้สามารถสร้างอินสแตนซ์ได้แม้กระทั่งเป็นของจริงสำหรับการเข้าถึงเครดิตเพื่อการประกันสิ่งต่าง ๆ เหล่านี้ การย้ายจาก "นี่คือแอปพลิเคชัน 18 หน้าของคุณ" และกระบวนการที่น่ารำคาญมากผ่านชุดการปฏิบัติตามกฎ 7 ชุดที่แตกต่างกันไปเป็นสิ่งที่สามารถเกิดขึ้นออนไลน์ได้ในแบบอัตโนมัติและเป็นวิธีที่เสี่ยงน้อยกว่าโดยทั่วไป

ดังนั้นแทนที่จะพิมพ์ลงใน Google เพื่อดูว่าพวกเขามีเว็บไซต์และเป็นของจริงหรือไม่คุณสามารถมีชุดข้อมูลอื่น ๆ เหล่านี้ตรวจสอบความถูกต้องสำหรับข้อมูลพื้นฐานได้หรือไม่

อย่างแน่นอน

เรากำลังพูดถึงก่อนที่เราจะแสดงสดเกี่ยวกับ Ozark ดังนั้นรายการโปรดของคุณรายการโปรดใหม่ของฉัน และแนวคิดของการใช้ชุดข้อมูลเหล่านี้เพื่อการปฏิบัติตามและสำหรับการรายงานทางการเงินและแม้แต่การตามล่าผู้ฟอกเงิน

ใช่. ก่อนอื่นหนึ่งในสิ่งที่ดีที่สุดแสดงให้เห็นว่ามี เสียบเข้ากับ Netflix อย่างมากกลายเป็นสตูดิโอฮอลลีวูดชั้นหนึ่ง

พวกเขาจ่ายไปแล้ว พวกเขาซื้อของในตลาด

พวกเขามีอย่างแน่นอน แต่การแสดงเป็นเรื่องเกี่ยวกับตัวละครของเจสันเบทแมนที่พบว่าตัวเองเป็นผู้ฟอกเงินต่อกลุ่มยานี้ สิ่งที่จับได้คือเขาช่วยชีวิตเขาโดยบอกว่าเขากำลังจะไปที่โอซาร์กและค้นหาช่องทางใหม่ในการฟอกเงิน เขาเริ่มซื้อธุรกิจที่เงียบสงบเหล่านี้จากนั้นก็ผ่านค่าใช้จ่ายที่หลากหลาย

ปัญหาการฟอกเงินเป็นปัญหาทางทฤษฎีอย่างมากในเรื่องนี้โดยสุจริตคุณกำลังมองหารูปแบบของกิจกรรมระหว่างผู้ค้าหรือผู้ใช้บริการทางการเงินที่แตกต่างกันและความเชื่อมโยงระหว่างกัน ดังนั้นคุณจะมีเหมือนตัวแทนที่ลงทะเบียนเห็นได้ชัดว่ามีคนอย่าง Jason Bateman ผู้ซึ่งกำลังเดินไปรอบ ๆ และทำสิ่งนี้เพื่อธุรกิจสองสามอย่าง เขากำลังซื้อแบบส่วนตัวกับพวกเขาและเริ่มได้ชื่อของเขาในหลากหลายรูปแบบและคุณจะสังเกตเห็นรูปแบบของกิจกรรม นี่คือสิ่งที่ธนาคารต้องต่อสู้อย่างชัดเจนเพราะมันเป็นอันตรายต่อระบบและพวกเขากำลังตะขอสำหรับการทำเช่นนี้

อาชญากรรมได้ผ่านระบบดิจิตอลไปแล้ว นี่เป็นปัญหาที่ใหญ่กว่ามาก ไม่มีครอบครัวม็อบใหญ่ ๆ กลุ่มหนึ่งที่รัฐบาลสามารถซุ่มอยู่รอบเดือนและทำให้พวกเขามีสไตล์คาโปน นี่คือการไล่ล่าในทุกด้าน เราได้ช่วยและพยายามนำข้อมูลสาธารณะมาพิจารณาปัญหานั้น แต่ยังนำเทคโนโลยีของเราที่เราเคยรวบรวมข้อมูลสาธารณะทั้งหมดนี้มาใช้ในการแก้ไขปัญหานั้นเพียงเพราะธนาคารมีการยกระดับเทคโนโลยีจำนวนมากเพื่อ ทำเพื่อรวมชุดข้อมูลของตัวเองให้เป็นเบาะแสที่มีประสิทธิภาพและเป็นบริบทสำหรับผู้ตรวจสอบที่พวกเขามีต่อเจ้าหน้าที่

ฉันรู้สึกว่าเราอยู่ในจุดที่ตอนนี้เรามีข้อมูลสาธารณะทั้งหมดที่สร้างโดยหน่วยงานของรัฐ เรามีชุดข้อมูลส่วนตัวเหล่านี้ทั้งหมด ทุก บริษัท มีชุดข้อมูลหลายชุดและรูปแบบที่แตกต่างกันหลายครั้งภายใน บริษัท เดียวกัน ยังไม่มีมาตรฐานจำนวนมากและการทำให้พวกเขาทำงานร่วมกันเป็นความท้าทายที่สำคัญ

มันเป็นความท้าทายที่ยิ่งใหญ่และอาจเป็นหนึ่งในวิทยานิพนธ์ที่ใหญ่ที่สุดที่เรามีที่อีนิกมาคือการแบ่งแยกครั้งใหญ่ นักลงทุนคนหนึ่งของฉันเรียกมันด้วยวิธีนี้ - มีโลกที่ข้อมูลมีหน่วยเป็นบิตและมีโลกที่มีเครื่องมือเป็นอะตอม บริษัท เทคโนโลยี, Google, Facebook, Amazon พวกเขาทำงานได้อย่างน่าทึ่งโดยใช้ข้อมูลที่ได้รับจากกิจกรรมของคุณท่องเว็บและสร้างบริการใหม่เหล่านี้เช่นการค้นหาและประสบการณ์อีคอมเมิร์ซที่ดีขึ้น แต่ข้อมูลนั้นมีอยู่ทั้งหมด มันเป็นแบบดิจิตัล เป็นเพียงการฟังคุณบนเว็บ เว็บเป็นโปรโตคอลและโปรโตคอลเหล่านั้นถูกออกแบบมาเพื่อพูดคุยกัน

แต่เมื่อคุณมีข้อมูลนี้ที่ประกอบเป็นอะตอมหรือในโลกแห่งความเป็นจริงเหมือนกับใครบางคนกำลังเข้าธนาคารใน Ozarks และขอสินเชื่อขนาดเล็กซึ่งดูแตกต่างจากคนอื่นที่เดินเข้าไปในสาขาธนาคารอื่นหรือตู้สินค้า เรือเข้ามาเพื่อขอชื่อ บริษัท ที่กำลังทำการจัดส่ง ข้อมูลทั้งหมดนี้ได้รับการออกแบบหรือไม่ได้ออกแบบมาเพื่อพูดคุยกันดังนั้นจึงมีปัญหาใหญ่ในการรวบรวมข้อมูลนี้เข้าด้วยกัน ฉันคิดว่ามันจะใช้เวลาน้อยกว่าอุตสาหกรรมเทคโนโลยีล้วน ๆ ใช้เวลานานกว่านี้เพื่อเก็บเกี่ยวผลประโยชน์จากสิ่งที่คุณเห็นในเทคโนโลยีด้วยข้อมูลขนาดใหญ่ แต่เมื่อพวกเขาทำฉันคิดว่ามันจะเปลี่ยนวิธีการที่เราใช้ชีวิตแบบวันต่อวันในลักษณะที่ค่อนข้างมีผลกระทบ

ฉันยังรู้สึกว่าเมื่อมีแรงจูงใจทางการเงินในการรวบรวมชุดข้อมูลเหล่านี้เข้าด้วยกันและสร้างความเข้าใจเชิงลึกเหล่านี้ธุรกิจจะหาวิธีชำระเงินและพวกเขาก็หาวิธีที่จะทำให้เสร็จ บริษัท บัตรเครดิตเป็นหนึ่งใน บริษัท แรก ๆ ที่สามารถระบุรูปแบบและระบุการฉ้อโกง ฉันรู้สึกว่าภาครัฐค่อนข้างล้าหลังเมื่อพูดถึงการสร้างข้อมูลเชิงลึกจากข้อมูลจำนวนนี้ นั่นเป็นการประเมินที่ยุติธรรมหรือไม่?

ภาคเอกชนมักจะมีความรู้สึกบางอย่างในด้านเทคโนโลยีการดำเนินงาน แรงจูงใจทางการเงินมีขนาดใหญ่และรูปแบบการดำเนินงานของหน่วยที่เล็กลง รัฐบาลสหรัฐฯเป็นเพียงหนึ่งในองค์กรที่ใหญ่ที่สุดในโลกและการทำทุกอย่างเป็นปัญหาของคนจริงๆ ทำให้แน่ใจว่ามีการจัดสิ่งจูงใจให้สอดคล้องกันทำให้แน่ใจว่าผู้คนรับความเสี่ยงในปริมาณที่เหมาะสม

แต่เราเคยเห็นว่ารัฐบาลทำสิ่งที่แปลกใหม่มาก เราร่วมมือกับเมืองนิวออร์ลีนส์ฉันคิดว่ามันเหมือนเมื่อสองปีก่อนเพื่อช่วยพวกเขาคาดการณ์ว่าเจ้าของสลัมอยู่ที่ไหนโดยส่วนใหญ่จะติดตั้งเครื่องตรวจจับควันในบ้านเหล่านี้ โพสต์ - แคทรีนาคุณมีจำนวนมากของการทำลาย เจ้าของบ้านจำนวนมากหนีไปกับการทิ้งคนที่มีสภาพไม่ดี สุจริตเครื่องตรวจจับควันเป็นเพียงงานที่ดีในการป้องกันความตายจากไฟไหม้ แทนที่จะส่งพนักงานดับเพลิงไปที่บ้านแบบสุ่มจะเกิดอะไรขึ้นถ้าคุณใช้ปัจจัยต่างๆเช่นข้อมูลประชากรและอายุของอาคารและครั้งสุดท้ายที่มีการติดตั้งโครงสร้างพื้นฐานบางประเภทเช่นโครงสร้างพื้นฐานโทรคมนาคม

คุณใช้ข้อเท็จจริงเหล่านี้ทั้งหมดและคุณจะได้รับอัตราการเข้าชมประตูที่คุณกำลังเคาะอยู่ซึ่งสูงกว่ามาก เราได้เห็นเม็ดเงินชนิดนี้มากมายสำหรับสิ่งที่รัฐบาลท้องถิ่นเล่นออกมาค่อนข้างแรง เห็นได้ชัดว่ามีการใช้ข้อมูลจำนวนมากในชุมชนข่าวกรองเท่าที่คุณจะจินตนาการได้ เราพบว่ามีนวัตกรรมมากมาย อีกครั้งว่ามันคือทั้งหมดที่เกี่ยวกับวิธีที่คุณใช้งานได้

คุณมีจุดข้อมูลเหล่านั้นทั้งหมด แต่จากนั้นคุณต้องค้นหาในวิธีที่เหมาะสมมองหารูปแบบ คุณต้องค้นหาสหสัมพันธ์และนั่นเป็นคำถามและคำตอบทั้งหมด มันกำลังสร้างความสัมพันธ์กับข้อมูลที่ฉันคิดว่าเราเพิ่งจะเริ่มคิดออกว่ามันทำงานอย่างไร

ใช่. เราเริ่มที่จะเข้าใจว่ามันทำงานอย่างไรจากมุมมองของชุดทักษะ และมีการเปลี่ยนแปลงจิตใจในแง่ของการคิดเชิงสถิติกับการคิดเชิงสถิติไม่ใช่ มีคำกล่าวนี้ว่า: "แบบจำลองทั้งหมดผิด แต่มีประโยชน์บางส่วน" - ดังนั้นจึงเป็นเรื่องจริงหรือไม่ที่คุณสามารถทำได้โดยไม่ต้องใช้ข้อมูลโดยไม่มีอัลกอริธึมตามบริบทพารามิเตอร์ความคิดทางสถิติของคุณ ฉันอาจไม่ได้รับสิทธินี้เช่นในกรณีเกิดเพลิงไหม้เราอาจไม่ได้รับสิทธินี้ แต่เราอาจเพิ่มโอกาสในการทำให้ถูกต้องหรือเราอาจลดความเสี่ยงของพื้นที่ผิวหรือสิ่งที่เราต้องค้นหา การนำทัศนคติที่ได้รับมาทำให้เกิดปัญหานั่นคือทักษะอันดับหนึ่งเมื่อพูดถึงความสามารถในการคิดเชิงสถิติ บางคนถูกขังอยู่ในนั้น "อืมวิธีเดียวที่เรามั่นใจได้คือถ้าเรามี X, Y และ Z"

ฉันจะให้กรณีในตัวอย่างส่วนตัว บ่อยครั้งในธนาคารด้วยเหตุผลของการฉ้อโกงทางประวัติศาสตร์และการปฏิบัติตามวิธีที่พวกเขาจะตรวจสอบว่ามีคนจริงก่อนที่พวกเขาจะออกบัตรเครดิตทำให้แน่ใจว่าหมายเลขโทรศัพท์และที่อยู่ตรงกับสิ่งที่พวกเขามีในใบสมัคร ไม่ใช่ทุก บริษัท ที่ใช้โทรศัพท์บ้านจริงในขณะนี้ ไม่ใช่ว่าทุก บริษัท จะใช้ที่อยู่หลักเป็นที่อยู่จริง มีความเป็นจริงที่ล้าสมัยของผู้คนที่ทำงานที่ WeWork ในขณะนี้และผู้คนที่ใช้เสียงผ่าน IP ทำความคุ้นเคยกับการระบุผู้คนผ่านการปรากฏตัวทางสังคมของพวกเขาหรือผ่านชุดข้อมูลบางส่วนที่เรานำเข้ามาที่อินิกมาที่ให้คะแนนการพิสูจน์เหล่านี้ การค้นหาและเรียกใช้สถิติในอดีตเพื่อดูว่าโอกาสในการเป็นจริงนั้นแข็งแกร่งหรือไม่กับการรับประกันที่คุณจะได้รับจากวิธีทางเลือกเหล่านี้ล่วงหน้า

ฉันคิดว่านั่นเป็นประเด็นที่น่าสนใจเช่นกันสมมติว่าทุกรุ่นจะผิดทั้งแบบผิดปกติหรือผิดเล็กน้อย แต่ก็โอเคเพราะมันยังช่วยให้คุณตัดสินใจได้ดี นั่นเป็นทักษะที่เราใช้ในการสอนลูก ๆ ของเราและพวกเขาจะได้รับการฝึกอบรมที่ไหน? ฉันหมายถึงมันไม่จำเป็นต้องใช้คณิตศาสตร์ มันจะไม่อยู่ในสังคมศึกษา พวกเขาได้รับความรู้สึกนั้นที่ไหน?

สถิติมักถูกจัดอยู่ในระดับย่อยเช่นการศึกษาคณิตศาสตร์โดยทั่วไป แต่คุณเห็นในที่อื่น ๆ คุณเห็นมันโผล่ขึ้นมาแม้ใน ESPN ของคุณฟีดวันนี้ ผู้คนสบายใจมากขึ้นกับการทำนายว่าเป็นส่วนหนึ่งของชีวิต สุจริตฉันรักช่วงเวลาหงส์ดำเหล่านี้ที่ทั้งหมดที่บินในหน้าของเรา ทำการเลือกตั้งครั้งล่าสุด คุณชนะฮิลารีและคุณมีนักวิทยาศาสตร์ด้านข้อมูลที่ดีที่สุดของโลกในบางสถาบันที่ดีที่สุดเรียกว่าผิด

การชนะ แต่การชนะไม่ได้มีโอกาสชนะถึง 70 เปอร์เซ็นต์เพราะนั่นยังหมายความว่าหนึ่งในสามของโดนัลด์ทรัมป์ชนะ และคาดเดาอะไร นี่เป็นหนึ่งในสามครั้งนั้น

อย่างแน่นอน และจากนั้นก็มีการศึกษาที่เราเห็นรูปแบบเหล่านี้ทำให้ผู้คนสบายใจขึ้น ในห้องเรียนฉันคิดว่าหนึ่งในปัญหาที่ใหญ่ที่สุดที่เรามีคือการเรียนรู้แบบประยุกต์ ฉันไม่ทราบเลยว่าทำไมพวกเขาถึงไม่สอนการเงินส่วนบุคคลในห้องเรียน ฉันหมายความว่าฉันเป็นคนงี่เง่าที่มีเงินของฉันตอนอายุ 18 และผลกระทบต่อหนี้สินและสิ่งเหล่านั้นทั้งหมด ฉันยังคงประหลาดใจที่พวกเขาไม่ทำเช่นนั้นดังนั้นฉันรู้สึกว่าเรากำลังเคลื่อนไหวในโลกที่การศึกษาจะได้รับมากขึ้นเกี่ยวกับสิ่งที่นำไปใช้และน้อยกว่าเกี่ยวกับทฤษฎี แต่ถ้าเป็นเช่นนั้นฉันต้องกังวลหากเราสูญเสียการเรียนรู้วัฒนธรรมไปบางส่วน มันคือการแลกเปลี่ยนทั้งหมด

ฉันจะไปไกลกว่านั้นและพูดคุยเกี่ยวกับปัญญาประดิษฐ์

ปัญญาประดิษฐ์เทคโนโลยีการเปลี่ยนแปลงอย่างมหาศาล ดูเหมือนว่าฉันจะมีบทบาทสำหรับปัญญาประดิษฐ์ในการช่วยให้เราทำความเข้าใจกับโลกของข้อมูลที่ล้นเหลือและค้นหารูปแบบเหล่านั้นสำหรับเรา คุณมองโลกในแง่ดีเกี่ยวกับ AI ช่วยให้เราเข้าใจหรือไม่หรือว่าจะเป็นสิ่งที่แยกออกจากประสบการณ์มนุษย์ที่เหลือของเราโดยสิ้นเชิง?

ไม่ฉันหมายถึงฉันเป็นคนมองโลกในแง่ดีว่าฉันเป็นคนมองโลกในแง่ดี ฉันรู้สึกว่าเป็นสิ่งที่พลิกยีนที่เกิดขึ้นกับคนในช่วงเวลา สิ่งหนึ่งที่ฉันชอบมากที่สุดเกี่ยวกับคำมั่นสัญญาของปัญญาประดิษฐ์คือมันจะช่วยให้เทคโนโลยีหายไปเพราะตอนนี้การมุ่งเน้นอยู่ที่เทคโนโลยีและข้อมูลที่มีอยู่ในปัจจุบัน แต่ในความเป็นจริงการทำงานของข้อมูลนั้นเข้มข้นมาก มีเหตุผลที่พวกเขาเรียกมันว่า data mining เมื่อคุณกำลังมองหาสิ่งของในชุดข้อมูล มันน่ารังเกียจมาก ชุดข้อมูลไม่สะอาด มันโหดเหี้ยมในแง่หนึ่ง

สิ่งที่ฉันชอบเกี่ยวกับ AI คือมันสร้างความคิดเห็นย้อนกลับจากประสบการณ์ที่สังเกตได้ แม้ว่าคุณกำลังรวบรวมข้อมูลทั้งหมดจากสถานที่เหล่านี้ทั้งหมด แต่คุณไม่จำเป็นต้องรู้ว่ามันจะมารวมตัวกันอย่างไรเพื่อที่คุณจะได้เริ่มศึกษาผลลัพธ์ การเรียนรู้ของเครื่องช่วยให้เรามีความมุ่งมั่นผลมากขึ้นในการคิดเชิงสถิติ ฉันคิดว่ามันจะช่วยให้เราสรุปความน่ารังเกียจบางอย่างของงานนั้นและให้ความสำคัญกับผลลัพธ์มากขึ้นในวิธีที่เราเข้าหามัน ตอนนี้มันจะน่ากลัวในแง่ของผลกระทบต่อระบบอัตโนมัติในบางพื้นที่ที่ตรงไปตรงมาฉันคิดว่า AI ควรจะถูกทิ้งไว้ตามลำพังเช่นแทนที่คณะลูกขุน เราจะได้รับคุณภาพความฉลาดทางอารมณ์นั้นหรือไม่? ฉันไม่รู้

และคุณต้องเลือกและพูดว่าคุณต้องการคุณภาพทางอารมณ์ในคณะลูกขุน ซึ่งตรงกันข้ามกับความเป็นไปได้ที่บุคคลคนนี้มีความผิดหรือไม่ผิด?

ใช่. สำหรับฉันมนุษย์พื้นฐานฉันคิดว่ามันสำคัญมาก เพียงแค่อยู่ในธุรกิจและเห็นว่าการสัมผัสของมนุษย์มีความสำคัญต่อการโน้มน้าวใจคนให้เริ่มคิดเชิงสถิติฉันคิดว่าเราจะไม่แพ้กับการกำเนิดของ AI

เราสัมผัสนิดหน่อยว่า LinkedIn เป็นชุดข้อมูลสาธารณะหรือไม่ ผู้คนจำนวนมากพวกเขามีความรู้สึกว่าพวกเขาอาศัยอยู่ในโลกนี้ที่ซึ่งทุกอย่างเกี่ยวกับพวกเขาพร้อมใช้งานออนไลน์ตั้งแต่รูปแบบการซื้อจนถึงอายุจนถึงประวัติทางการแพทย์ของพวกเขา มันทำให้คนไม่สบายใจ ทำให้คนกังวลว่ารัฐบาลมีข้อมูลมากเกินไป โดยส่วนตัวแล้วฉันกังวลว่า บริษัท เอกชนมีข้อมูลมากเกินไปและพวกเขาก็ควบคุมน้อยกว่ามาก

ใช่.

เราจำเป็นต้องมีกฎหมายเพื่อปกป้องข้อมูลส่วนบุคคลของเราหรือไม่? ข้อมูลส่วนบุคคลควรได้รับการปฏิบัติแยกต่างหากจากบันทึกของรัฐบาลของคุณหรือไม่

อย่างแน่นอน เราได้รับความคุ้มครองน้อยมากตามกฎหมายที่ควบคุมวิธีการที่เราให้ข้อมูลของเราออกไป คิดในบางอาชีพ ในวงการแพทย์มันกำลังปิดตัวลง แต่ด้วยเหตุผลบางอย่างมันไม่จำเป็นต้องล็อคดาวน์ในอุตสาหกรรมอื่น ๆ เหตุผลก็คือหลังจากนั้นคุณไม่สามารถทำอะไรกับข้อมูลส่วนบุคคลของคุณได้มากนัก วันนี้พวกเขามีความรู้สึกที่ดีในการทำให้คุณกลับใจใหม่หรือโอกาสที่คุณจะอยู่ที่ไหนสักแห่ง สำหรับทุกเจตนารมณ์และวัตถุประสงค์นั่นเป็นประโยชน์ต่อเราในความคิดของฉัน

แต่ในเวลาเดียวกันข้อมูลของเรายังคงสมควรได้รับความศักดิ์สิทธิ์ในการจัดการ ยุโรปกำลังออกกฎหมายที่แข็งแกร่งมากออกมา มีกฎหมายออกมาเรียกว่า GDPR กำหนดให้มีการประกาศใช้ในปี 2561 และดำเนินการทุกอย่างจากการทำให้แน่ใจว่า บริษัท กำลังติดตามเชื้อสายของข้อมูลส่วนบุคคลของพวกเขาที่มีข้อมูลการเข้าถึงข้อมูลภายใน บริษัท สิทธิ์ในการถูกลืม เมื่อคุณพูดว่า "ลบข้อมูลของฉัน" คุณกำลังลบข้อมูลจริงหรือคุณเก็บข้อมูลอื่น ๆ ดังนั้นจึงมีการแลกเปลี่ยนระหว่างผู้บริโภคและบริการที่พวกเขาทำงานอยู่เสมอ บริการเหล่านี้ฟรีและเรารักพวกเขาใช่ไหม?

ฉันจะให้ส่วนหนึ่งของตัวเองเพื่อการเข้าถึง YouTube ใช่ไหม? ฉันมีความสุขมากเกี่ยวกับเรื่องนี้

และอาจคุณมี

และอาจฉันมี แต่นั่นไม่ได้หมายความว่าส่วนที่ฉันให้ไปไม่ควรใส่ในตู้เซฟและฉันรู้ว่ากล่องนั้นอยู่ใต้บังเกอร์และสิ่งดี ๆ เหล่านั้นทั้งหมด

นอกจากนี้แนวคิดของการหมดอายุของข้อมูลซึ่งในโลกดิจิตอลในปัจจุบันเป็นแนวคิดที่ค่อนข้างใหม่ มันเคยเป็นที่มีความสับสนบางอย่าง หากบางสิ่งบางอย่างเกิดขึ้นเมื่อ 30 ปีก่อนมันจะเป็นการยากที่จะหาบันทึกและรับโปรไฟล์จากตอนนั้น แต่วันนี้เด็ก ๆ ที่ออนไลน์ตลอดชีวิตของพวกเขาและสิ่งที่พวกเขาทำและโพสต์เมื่อพวกเขาอายุ 13 ปีจะอยู่ที่นั่นเมื่อพวกเขาอายุ 63

ใช่.

เราไม่มีโครงสร้างพื้นฐานทางกฎหมายที่สามารถจัดการกับสิ่งนั้นในทางที่มีความหมาย

ไม่เราทำไม่ได้และเป็นพื้นที่ที่มีขนดก เป็นพื้นที่มีขนดกในกฎหมายการจ้างงาน มันมีขนดกสำหรับออกเดทใช่ไหม

หากคุณดูที่โปรไฟล์ Facebook ของใครบางคน - ฉันคิดว่าวัฒนธรรมจะปรับให้เข้ากับสถานะการออนไลน์ของใครบางคนที่เป็นสาธารณะ แต่มันเกือบจะเป็นละคร มันเหมือนกับว่าการปรากฏตัวต่อหน้าสาธารณะของคุณไม่ใช่ตัวตนของคุณ ภาพยนตร์เรื่อง Jim Carey นั่นคืออะไร? เราทุกคนใส่หน้ากากพูดเชิงเปรียบเทียบ ดังนั้นฉันคิดว่าสถานะออนไลน์ของคุณจะเป็นเหมือนแกลเลอรีนี้หรืองานศิลปะชิ้นนี้ที่อธิบายคุณแล้วมีตัวตนจริง แต่คุณยังคงทำตัวถูกยิงหรืออะไรทำนองนั้น … คุณไม่ต้องการเปิดเผยต่อสาธารณะ มีคำถามที่แท้จริงว่าคนหนุ่มสาวมีความสามารถในการตัดสินใจว่ามันฉลาดที่จะทำให้ออนไลน์หรือไม่ มันน่ากลัวแน่นอน

พูดถึงเรื่องงี่เง่าออนไลน์พูดคุยเกี่ยวกับการบริหารของทรัมป์ ฉันเคยได้ยินในหลายมุมมอง … คุณเห็นได้ชัดว่าทำงานกับชุดข้อมูลสาธารณะจำนวนมาก คุณต้องไปขออนุญาตเพื่อรับข้อมูลนี้หลายครั้งหรือหาวิธีนำเข้ามาใช้ ตอนนี้มันง่ายกว่าไหม? การเข้าถึงชุดข้อมูลสาธารณะเปลี่ยนแปลงอย่างไรตั้งแต่การบริหารของทรัมป์เข้ารับตำแหน่ง

ใช่. ข้อแม้แรกของฉันเมื่อฉันพูดถึงสิ่งนี้คือความแตกต่างใหญ่ระหว่างการบริหารของทรัมป์และรัฐบาลสหรัฐฯ รัฐบาลสหรัฐฯเป็นหนึ่งในสถาบันที่โปร่งใสกว่าที่ฉันเคยพบมาในโลก เรามีความโปร่งใสอย่างดุเดือดเทียบกับเพื่อนร่วมงานของเราสำหรับจำนวนข้อมูลที่เรานำออกไปเพราะเราให้ทุนสนับสนุนสิ่งของประเภทนี้มากแค่ไหน

เมื่อพูดถึงทรัมป์ฉันหมายถึงมันชัดเจนสำหรับฉันว่าทุกคนควรวิตกกังวลมากเกี่ยวกับจุดยืนของการบริหารนี้ด้วยความโปร่งใสและการแบ่งปันข้อมูล ก่อนอื่นมีสิ่งที่ชัดเจนมากเช่นการบันทึกรายชื่อผู้มาเยือนทำเนียบขาวซึ่งเป็นแนวทางปฏิบัติที่โอบามาใช้และฉันคิดว่าระบบบัญชีที่สำคัญที่สุดของรัฐบาล มีข้อมูล EPA มีข้อมูลสภาพภูมิอากาศและโดยทั่วไปมีการถกเถียงกันถึงข้อมูลสำมะโนประชากรบางส่วนที่ได้รับผลกระทบจากสิ่งนี้ คุณต้องจำไว้ว่าสิ่งเหล่านี้ไม่ใช่ความพยายามเล็กน้อย ฉันคิดว่าการสำรวจสำมะโนประชากรของสหรัฐเป็นการลงทุนมากกว่า 4 พันล้านเหรียญทุกครั้งที่เกิดขึ้นโดยมีอาสาสมัครกว่า 300, 000 คนที่เกี่ยวข้อง

บางสิ่งเหล่านี้เราจะเห็นผลกระทบของมันในสี่ปีเพิ่งได้รับรอบการระดมทุนว่ามันเกิดขึ้นได้อย่างไร แม้ว่าการบริหารนี้จะไม่เป็นมิตรแน่นอนฉันคิดว่ากระดูกสันหลังในประเทศนี้มีความแข็งแกร่งเพียงพอ น่าแปลกที่มาจากทั้งซ้ายและขวา แข็งแกร่งพอที่จะทำให้แน่ใจว่าการเคลื่อนไหวนี้ไปสู่การเปิดกว้างของข้อมูลอยู่ที่นี่อยู่

และมีชุดข้อมูลเหล่านี้มากมาย

ใช่. มันเป็นวิธีที่เราตัดสินใจว่าจะใส่โรงพยาบาลไว้ที่ไหน มันเป็นวิธีที่เราตัดสินใจว่าจะจัดเส้นทางรถพยาบาล นี่คือวิธีที่เราตัดสินใจเลือกบริการพื้นฐานมากมายเช่นการจัดการขยะต้องอาศัยสิ่งเหล่านี้

บอกผู้ที่กำลังดูชุดข้อมูลสาธารณะของ Enigma ซึ่งฉันเคยไปหลายครั้งแล้ว … สุดยอดเยี่ยม ผู้คนคาดหวังอะไรเมื่อพวกเขาไปที่นั่น? พวกเขาจะได้อะไรจากมัน

หนึ่งในพันธสัญญาของเราคือการซื่อสัตย์ต่อภารกิจในการเก็บรวบรวมข้อมูลทั้งหมด แต่ให้คืนเท่าที่เราสามารถทำได้ ไม่มีค่าใช้จ่ายในการใช้เพื่อวัตถุประสงค์ที่ไม่ใช่เชิงพาณิชย์ เราต้องการให้แน่ใจว่าทุกคนสามารถเข้าถึงข้อมูลนี้ได้ คุณไม่จำเป็นต้องลงชื่อเข้าใช้หรือต้องการให้ข้อมูลใด ๆ แก่เราเพื่อดำเนินการต่อและเข้าถึง เมื่อเราก่อตั้ง บริษัท มีหลักฐานสำคัญในการเข้าถึง

เนื่องจากเราได้เรียนรู้มากขึ้นตลอดหลายปีที่ผ่านมาการออกแบบการเข้าถึงและอินเทอร์เฟซและการค้นหาและความน่าเชื่อถือจึงเป็นสิ่งสำคัญมาก อีกเรื่องหนึ่งคือการดูแลเอาใจใส่และนั่นเป็นจุดสนใจที่ยิ่งใหญ่ของ Enigma Public ที่เราเปิดตัวอีกครั้งในฤดูร้อนนี้เป็นความคิดที่ว่าผู้คนจำเป็นต้องรู้ว่าข้อมูลนี้ถูกนำไปใช้อย่างไร ผู้คนจำเป็นต้องรู้ไม่เพียง แต่วิธีปฏิบัติที่ดีที่สุดสำหรับวิธีการทำงานกับข้อมูล แต่ชุดข้อมูลใดที่ดีสำหรับสิ่งที่ มีอะไรใหม่มีอะไรน่าตื่นเต้นบ้าง? ฉันคิดว่าการศึกษาแบบนี้เป็นสิ่งที่เราตื่นเต้นมากที่ได้เป็นส่วนหนึ่งและสิ่งที่เราหวังว่าผู้คนจะได้รับอย่างที่สองที่พวกเขามาถึงบนเว็บไซต์

มันคุ้มค่าที่จะเช็คเอาท์ ฉันคิดว่าอีกครั้งธุรกิจเห็นว่าข้อมูลและพวกเขารู้ว่าพวกเขาสามารถสร้างธุรกิจที่อยู่ด้านบนของมัน ฉันคิดว่าสำหรับนักข่าวและสำหรับประชาชนมีการศึกษาที่จำเป็นมากขึ้น

แน่นอนการศึกษาที่มากขึ้นและหวังว่าจะเป็นบริการชั้นหนึ่งที่เหนือสิ่งอื่นใดที่มอบสิ่งต่าง ๆ ให้กับผู้คนเช่นฉันและคุณเมื่อเราไม่กล้าพูดออกไป

ให้ฉันถามคำถามที่ฉันถามทุกคนที่มาในรายการ แนวโน้มเทคโนโลยีใดที่เกี่ยวข้องกับคุณมากที่สุด มีอะไรที่ทำให้คุณตื่นขึ้นมาตอนกลางคืนหรือไม่?

แนวโน้มที่เกี่ยวข้องกับฉันมากที่สุดหรือสิ่งที่ฉันคิดว่าบนขอบฟ้าที่เราควรระวังให้มากที่สุดคือแนวคิดเรื่องการเขียนโปรแกรมทางชีววิทยาดังนั้นขอบเขตที่เราได้รับดีขึ้นมากในการสร้างโปรแกรมการใช้ชีวิตทางชีวภาพ สิ่งมีชีวิต นั่นมีผลกระทบอย่างมากต่อสิ่งที่ดี แต่ก็มีผลกระทบอย่างมากต่อความสามารถในการสร้างขนาดเล็ก ไม่ว่าเทคโนโลยีและชีวประวัติจะพบกันที่ไหนฉันก็กังวลเล็กน้อยเกี่ยวกับวิธีการจัดการ มันเหมือนคลื่นลูกใหม่สำหรับฉันที่โพสต์นิวเคลียร์เป็นความสามารถของเราในการทำสิ่งต่าง ๆ เช่นเรียงลำดับทางโปรแกรมในห้องปฏิบัติการขนาดเล็กและแจกจ่ายมัน

ความท้าทายคือแม้ว่าเราจะผ่านกฎหมายที่นี่ในสหรัฐอเมริกานั่นไม่ได้หมายความว่ามีคนไม่สามารถทำการวิจัยเดียวกันในประเทศจีนหรือในรัสเซีย

แน่นอน - และแม้กระทั่งจากมุมมองด้านความปลอดภัยใช่ไหม ดังนั้นเราจึงเริ่มที่จะมีวิธีการสำหรับทุกคนที่จะ DIY โปรแกรมสงครามชีวภาพของตัวเอง ดังนั้นสำหรับฉันเป็นสิ่งที่เกี่ยวข้องกับฉันมากที่สุด แต่ flipside รวมถึงสิ่งต่าง ๆ เช่นยาเฉพาะบุคคลความจริงที่ว่าคุณสามารถเข้าใจร่างกายของฉันจริง ๆ คุณสามารถสร้างโปรแกรมซอฟต์แวร์รุ่นชีวภาพที่ออกแบบมาเพื่อรักษาอาการเจ็บป่วยใด ๆ ที่ฉันมี เช่นเดียวกับฉันฉันก็รู้สึกตื่นเต้นกับสิ่งนั้น

ฉันคิดว่าข้อบกพร่องที่เกิดขึ้นคือเราต้องการโครงสร้างทางจริยธรรมบางอย่างที่จะนำเทคโนโลยีใหม่มาใช้เราทำมันด้วยอาวุธนิวเคลียร์และพลังงานนิวเคลียร์แทบจะไม่ แต่เราทำที่นั่นและฉันคิดว่าเราจะต้องพัฒนาบางอย่าง คล้ายคลึงกัน ในระดับบุคคลมีเทคโนโลยีที่คุณใช้ทุกวันที่เพิ่งเปลี่ยนชีวิตของคุณที่คุณประหลาดใจด้วยหรือไม่?

นี่เป็นเรื่องแปลก แต่ก็เป็น FaceTime หรือวิดีโอแชท ฉันมีสมาชิกในครอบครัวในต่างประเทศและฉันเดินทางไปทำงานเป็นจำนวนมาก ความแตกต่างระหว่างการใช้โทรศัพท์และวิดีโอแชทเป็นไปอย่างสบาย ๆ บนโทรศัพท์มันทำให้ฉันรู้สึกว่าคำสัญญาทั้งหมดที่อินเทอร์เน็ตเชื่อมต่อกับทุกคน ความสามารถในเวลาประมาณ 15 วินาที ฉันมาจากประเทศโมร็อกโกดังนั้นเห็นใครบางคนทั่วโลกและพูดว่า "เฮ้คุณเป็นอะไรไป?" เมื่อเห็นว่าสภาพอากาศเป็นอย่างไรในสภาพแวดล้อมของพวกเขาและการแต่งตัวและพฤติกรรมของพวกเขามันเปลี่ยนไปอย่างมากว่าฉันรู้สึกอย่างไรกับคนรอบตัวฉันและทำให้ฉันรู้สึกว่าพวกเราทุกคนอาศัยอยู่ในหมู่บ้านใหญ่นี้อีกแล้ว ชอบความรู้สึกนั้น

มีบางอย่างที่น่าสนใจเช่นกันฉันดูการประชุมทางวิดีโอที่เพิ่มขึ้นอย่างรวดเร็ว มันจะเป็นสิ่งต่อไป จะไม่มีใครโทรออกอีกแล้ว การประชุมทางวิดีโอไม่เคยถูกถอดออกจริงๆ แต่วิดีโอแชทมีความเป็นส่วนตัวมากขึ้นแตกต่างกันอย่างมากและไม่ได้อยู่ในสภาพแวดล้อมการทำงานอะไรที่เกือบจะไม่เป็นทางการมากกว่าการโทรศัพท์ มันอาจเป็นสิ่งที่เกิดขึ้นทันที

ฉันมีลูกสาวอายุ 3 ขวบและเธอก็มีปัญหามากมาย เธอวิดีโอแชทก่อนโทรศัพท์ เธอไม่รู้ว่าโทรศัพท์คืออะไร คุณวางโทรศัพท์ลำโพงและคุณขอให้เธอแชทกับใครบางคนและเธอไม่สนใจเลย คุณทำให้เธอต่อหน้าปู่ของเธอใน FaceTime และเธออาจอยู่ที่นั่นประมาณ 20 นาที

มันจะเป็นเรื่องแปลกสำหรับเธอเช่นเดียวกับโทรศัพท์หมุนที่เด็ก ๆ ทุกวันนี้ไม่รู้วิธีใช้ ไฮแชมผู้คนสามารถติดตามคุณทางออนไลน์ได้อย่างไรค้นหาสิ่งที่คุณทำและติดตาม Enigma

ไปที่ enigma.com ตรวจสอบ Enigma Public อย่างแน่นอนนั่นคือ public.enigma.com ตรวจสอบเว็บไซต์ของเรา เรามีบัญชี Twitter ที่ใช้งานได้ดีไม่มี Instagram สำหรับเรา

ไม่เคยพูดไม่เคย

ไม่เคยพูดไม่เคย แต่-

คุณสามารถทำสิ่งที่ดีกับอินโฟกราฟิก

ใช่นั่นเป็นเรื่องจริง. เราเป็นแฟนตัวยงของข้อมูลจำนวนมาก เรามีส่วนที่น่าสนใจในไซต์ของเราที่ labs.enigma.com ซึ่งทั้งหมดนี้เป็นการทดลองของเราและโปรเจคโบโบโปรอย่างโครงการที่ฉันพูดถึงกับนิวออร์ลีนส์ดังนั้นฉันก็ตรวจสอบด้วยเช่นกัน

เด็ดมาก ขอบคุณมากที่เข้ามา

น่ากลัว ขอบคุณมากที่มีฉัน

วิธีการใช้ข้อมูลขนาดใหญ่กับโลกแห่งความจริง