บ้าน ธุรกิจ Google ลดความซับซ้อนของการเรียนรู้ของเครื่องด้วย sql

Google ลดความซับซ้อนของการเรียนรู้ของเครื่องด้วย sql

สารบัญ:

วีดีโอ: A day with Scandale - Harmonie Collection - Spring / Summer 2013 (กันยายน 2024)

วีดีโอ: A day with Scandale - Harmonie Collection - Spring / Summer 2013 (กันยายน 2024)
Anonim

ขณะนี้ Google ได้เพิ่มขีดความสามารถในการเรียนรู้ของเครื่อง (ML) ให้กับ Google BigQuery ซึ่งเป็นฐานข้อมูลคลาวด์ขนาดพิตาไบต์ (PB) ของ บริษัท ตอนนี้ขนานนาม BigQuery ML แล้วเวอร์ชันใหม่จะให้คุณใช้คำสั่ง Structured Query Language (SQL) แบบง่าย ๆ ในการสร้างและปรับใช้โมเดล ML สำหรับการวิเคราะห์เชิงทำนาย

นั่นไม่ใช่แค่ข่าวดีสำหรับนักวิทยาศาสตร์ด้านข้อมูลที่ใช้ Google นอกจากนี้ยังเป็นสิ่งที่ดีสำหรับผู้ประกอบการที่สนใจในการพัฒนาขีดความสามารถในการวิเคราะห์ข้อมูลเพราะจะเพิ่มคู่แข่งที่มีประสิทธิภาพมากขึ้นไปยังรายชื่อผู้ขายที่ค่อนข้างเล็กซึ่งสามารถส่งมอบความซับซ้อนในระดับนี้ผ่านระบบคลาวด์ อีกสองชื่อที่รู้จักกันดีที่สุดคือบริการฐานข้อมูลเชิงสัมพันธ์ของ Amazon และ Azure SQL ของ Microsoft และคุณสามารถค้นหาเพิ่มเติมได้จากบริการฐานข้อมูลคลาวด์ล่าสุดของเรา

ความหายนะของผู้ขายและผู้ซื้อผลิตภัณฑ์ข้อมูลทั้งหมดเป็นช่องว่างด้านทักษะเสมอ นั่นเป็นเรื่องจริงโดยเฉพาะอย่างยิ่งสำหรับผู้ที่สนใจ ML และการวิเคราะห์เชิงพยากรณ์เนื่องจากสาขาวิชาเหล่านี้มักต้องการความรู้เกี่ยวกับเทคโนโลยีใหม่และการสืบค้นภาษา

"สำหรับนักวิทยาศาสตร์ด้านข้อมูลทุกคนมีนักวิเคราะห์หลายร้อยคนที่ทำงานกับข้อมูลและส่วนใหญ่ใช้ SQL" Sudhir Hasbe ผู้อำนวยการฝ่ายจัดการผลิตภัณฑ์ของ Google Cloud กล่าวกับ PCMag บางสิ่งต้องให้ถ้าพลังของกองทัพนักวิเคราะห์ข้อมูลถูกถอดออกจากคอขวดที่สร้างขึ้นโดยนักวิทยาศาสตร์ข้อมูลน้อยเกินไปและทำงานหนักเกินไป

คำตอบของ Google สำหรับภาวะที่กลืนไม่เข้าคายไม่ออกนี้ไม่มีอะไรสั้นที่โดดเด่น ในขณะที่ ML เป็นเทรนด์ที่ร้อนแรงและปรากฏในผลิตภัณฑ์ทุกชนิด แต่ก็ยังคงเป็นพื้นที่สำหรับนักวิทยาศาสตร์ด้านข้อมูล ผู้ค้าจำนวนมากได้ใช้ความก้าวหน้าในการทำให้เทคโนโลยีง่ายขึ้น แต่ความจริงที่น่าเกลียดคือคุณสามารถทำให้มันง่ายขึ้นมากและมันก็ยังคงยากเกินกว่าจะใช้ประชากรมนุษย์ได้มากกว่า 99% ถึงกระนั้นเราจำเป็นต้องใช้มันเพราะ ML สามารถทำอะไรได้มากกว่าและทำได้เร็วกว่ากลุ่มมนุษย์ที่ฉลาดหลักแหลม

Google กำลังวาง ML ใน Google BigQuery เพื่อให้อยู่ใกล้กับข้อมูลมากขึ้น แอปพลิเคชันจะทำให้ความสามารถของ ML เร็วขึ้นกว่ารุ่น ML บางส่วนเนื่องจากการวิเคราะห์ข้อมูลสามารถทำได้ที่แหล่งที่มา ขณะนี้อยู่ในรุ่นเบต้า BigQuery ML ช่วยให้นักวิเคราะห์ (และนักวิทยาศาสตร์ด้านข้อมูล) สามารถเรียกใช้การวิเคราะห์เชิงพยากรณ์เช่นการคาดการณ์ยอดขายและการสร้างกลุ่มลูกค้าตรงด้านบนของข้อมูลที่จัดเก็บไว้ นั่นเป็นเพียงการอัปเกรดที่น่านับถือและโดดเด่น

อย่างไรก็ตาม Google ก้าวไปไกลกว่านั้นด้วยการเพิ่มความสามารถที่ช่วยให้นักวิเคราะห์ข้อมูลสามารถใช้คำสั่ง SQL อย่างง่ายในการสร้างและปรับใช้โมเดล ML ตอนนี้ตัวเลือกคือแบบจำลองการถดถอยเชิงเส้นและแบบจำลองการถดถอยโลจิสติกสำหรับการวิเคราะห์เชิงทำนายเนื่องจากเป็นแบบจำลองที่ใช้กันมากที่สุดสองแบบ

นี่คือภาพประกอบที่ Google จัดทำขึ้นเพื่อแสดงให้เห็นว่านักวิเคราะห์ข้อมูลจะใช้ความสามารถนี้ได้อย่างไร:

Google วางแผนที่จะเพิ่มตัวเลือก ML เพิ่มเติมสำหรับความสามารถนี้เมื่อเวลาผ่านไปตาม Hasbe “ เราจำเป็นต้องได้รับการตอบรับจากลูกค้าของเราว่าต้องการให้เราเพิ่มโมเดลใดเพื่อให้เราได้นำเสนอสิ่งที่มีประโยชน์มากที่สุดก่อน” เขากล่าว

การอัพเกรด Google BigQuery เพิ่มเติม

การเพิ่มรายการอัปเกรดที่สำคัญหลังจาก ML คือความสามารถในการจัดกลุ่มระบบข้อมูลทางภูมิศาสตร์ BigQuery (BigQuery GIS) ตัวเชื่อมต่อข้อมูล Google ชีตใหม่และตัวเชื่อมต่อข้อมูล Google ชีตใหม่

การทำคลัสเตอร์ ยังอยู่ในช่วงเบต้าและเปิดใช้งานการสร้างตารางคลัสเตอร์ในการย้ายการปรับให้เหมาะสมข้อมูลที่อัดแน่นแถวที่มีคีย์คลัสเตอร์ที่คล้ายกันเข้าด้วยกัน สิ่งนี้จะช่วยลดค่าใช้จ่ายเนื่องจากช่วยปรับปรุงประสิทธิภาพและทำให้ Google BigQuery สามารถเรียกเก็บเงินจากผู้ใช้เฉพาะสำหรับข้อมูลที่สแกนมากกว่าตารางหรือพาร์ติชั่นทั้งหมด

BigQuery GIS ปัจจุบันเป็นอัลฟาและใช้สำหรับการวิเคราะห์ข้อมูลเชิงพื้นที่ ในขณะที่ทีม Google Cloud ร่วมมือกับ Google Earth Engine เพื่อสร้าง BigQuery GIS คุณต้องนำข้อมูลเชิงพื้นที่ของคุณมาไว้ที่โต๊ะ นั่นไม่ใช่ปัญหาในและในหลายอุตสาหกรรมรวมถึงระบบรถยนต์ที่เชื่อมต่อ Internet of Things (IoT), การผลิต, การค้าปลีก, เมืองอัจฉริยะและ telematics ไม่ต้องพูดถึงหน่วยงานภาครัฐตั้งแต่ Environmental Protection Agency (EPA) และ National Geospatial-Intelligence Agency ไปจนถึงการบริหารมหาสมุทรและบรรยากาศแห่งชาติ (NOAA) และทุกสาขาวิชาทหาร

BigQuery GIS ใช้ไลบรารี S2 ซึ่งขณะนี้มีผู้ใช้มากกว่าพันล้านคนผ่านผลิตภัณฑ์ที่หลากหลายเช่น Google Earth Engine และ Google Maps หากคุณต้องการข้อมูลเชิงพื้นที่เพิ่มเติมจากนั้นรัฐบาลจะแบ่งปันจำนวนมหาศาลบน GeoPlatform

ตัวเชื่อมต่อข้อมูล Google ชีตใหม่ มีแนวโน้มที่จะสร้างความพึงพอใจให้กับนักวิเคราะห์ข้อมูลจำนวนมากเพียงเพราะมันใช้งานได้จริงในชีวิตประจำวัน คุณสามารถเข้าถึง Google BigQuery ได้จาก Google ชีต (โปรแกรมสเปรดชีต) และใช้เครื่องมือ Google ชีตเช่นสำรวจซึ่งเป็นการทำงานร่วมกันแบบรวมการสร้างภาพข้อมูลและเครื่องมือสืบค้นข้อมูลภาษาธรรมชาติ

Google BigQuery มีส่วนติดต่อผู้ใช้ (UI) ใหม่ในรุ่นเบต้าด้วยเช่นกัน หนึ่งในองค์ประกอบที่น่าสนใจคือฟังก์ชั่นการสร้างภาพข้อมูลด้วยคลิกเดียวซึ่ง Google Data Studio รองรับ ทั้งหมดบอกว่ามันเป็นการอัพเกรดที่ยอดเยี่ยมสำหรับบริการที่สวยงามอยู่แล้ว การอัปเกรดเหล่านี้จะได้รับการทดสอบในรอบถัดไปของการทบทวนโซลูชัน Database-as-a-Service (DBaaS) ของ PCMag หลังจากข้อบกพร่องได้รับการแก้ไขและผลิตภัณฑ์ได้ย้ายเกินสถานะอัลฟ่าและเบต้าตามลำดับ

PCMag EIC Dan Costa กล่าวถึงอนาคตของข้อมูล:
Google ลดความซับซ้อนของการเรียนรู้ของเครื่องด้วย sql