วีดีโอ: A day with Scandale - Harmonie Collection - Spring / Summer 2013 (ธันวาคม 2024)
ผู้ช่วยอัจฉริยะ - Siri, Google Now, Cortana และคนอื่น ๆ - ได้หายไปจากความอยากรู้อยากเห็นและกลอุบายเมื่อไม่กี่ปีที่ผ่านมาจนถึงเครื่องมือสำคัญที่หลายคนใช้ในชีวิตประจำวัน เมื่อสัปดาห์ที่แล้วฉันได้เข้าร่วมการประชุม Intelligent Assistants ในนิวยอร์กที่นำเสนอโดย Opus Research และรู้สึกประทับใจกับความคืบหน้าของซอฟต์แวร์ในอุตสาหกรรมหลากหลายรวมถึงความก้าวหน้าทางการเงินการประกันภัยและ บริษัท แพทย์ในการสร้างตัวแทนเฉพาะ .
Dan Miller ผู้ก่อตั้ง Opus Research ได้อธิบายว่าเทคโนโลยีหลักหลายอย่างเช่นการรู้จำเสียงพูดนั้นมีมานานกว่า 20 ปีแล้ว แม้ว่าเขาเพิ่งจะเห็นการปรับปรุงที่ยิ่งใหญ่มากกว่าการปฏิวัติเขากล่าวว่า "เรากำลังอยู่บนเส้นทางแห่งวิวัฒนาการ" ด้วยผลิตภัณฑ์จำนวนมากบนความต่อเนื่องที่มีความสามารถที่แตกต่างกัน เขากล่าวว่ามีผู้ช่วยอัจฉริยะระดับองค์กรหลายร้อยคนที่สามารถใช้สำหรับการสนทนาแบบข้อความโดยใช้ภาษาอังกฤษธรรมดาโดยใช้ชุดข้อมูลคงที่และสิ่งต่าง ๆ เช่นการนำทางเว็บไซต์หรือคำถามที่พบบ่อย อีกด้านหนึ่งของสเปกตรัมอาจมีแอพ "ไดนามิกที่ให้ความรู้สึกของมนุษย์" เพียงไม่กี่โหลเท่านั้นที่สามารถสนทนาและรับรู้บริบทได้มากขึ้น
มิลเลอร์ชี้ไปที่แอปพลิเคชันที่ได้รับรางวัลในการประชุม จูลี่ของแอมแทร็กเริ่มต้นจากการเป็นตัวแทนบริการโทรศัพท์ตอบรับเสียงโต้ตอบเมื่อหลายปีก่อน แต่ตอนนี้ได้พัฒนาเป็นตัวแทนที่ทำงานบนเว็บไซต์เพื่อแนะนำนักท่องเที่ยวผ่าน Amtrak.com โดยอ้างอิงจากตัวแทนของ Next IT Telefonica Mexico มีตัวแทนชื่อ Nico ที่มีรูปแทนตัวและยังให้การสนับสนุนผ่านทาง Twitter และ Facebook ตามแพลตฟอร์มของ AgentBot ING Netherlands มี Inge แอพที่ให้คุณตรวจสอบยอดเงินในบัญชีธนาคารของคุณหรือโอนเงินผ่านเสียงโดยใช้เทคโนโลยีไบโอเมตริกซ์เสียงจาก Nuance เพื่อตรวจสอบตัวตนของคุณ
รางวัลชมเชยรวมถึงแอพพลิเคชั่นด้านการดูแลสุขภาพเช่นแอพที่ช่วยคุณเลือกแผนการดูแลสุขภาพ แอปพลิเคชั่นอื่น ๆ ที่ฉันได้ยินในการแสดงรวมถึง Domino's Pizza ซึ่งมีแอพที่เรียกว่า Dom ที่ให้คุณใช้เสียงสั่งพิซซ่า และ BMW ซึ่งมีตัวแทนเสมือนเป็นส่วนหนึ่งของ Up2drive ระบบจัดหาสินเชื่ออัตโนมัติ
Brett Beraneck ของ Nuance พูดคุยเกี่ยวกับความก้าวหน้าของเครือข่ายนิวรัลการเรียนรู้ขั้นสูงที่ได้พัฒนาสิ่งต่าง ๆ เช่นการทำความเข้าใจภาษาธรรมชาติและการจดจำเสียงและตอนนี้สิ่งนี้มารวมกันเพื่อทำให้เกิดความสนใจมากขึ้น ตัวอย่างแรกของผู้ช่วย Nina ของ Nuance และตั้งแต่นั้นมาก็เพิ่มขึ้นเป็นแอพพลิเคชั่นเฉพาะมากมายตั้งแต่ระบบตอบโต้ด้วยเสียงแบบโต้ตอบที่ บริษัท ประกันภัยไปจนถึงแอพซื้อของ แต่ละแอปพลิเคชันเหล่านี้มีบุคลิกที่แตกต่างกันไปขึ้นอยู่กับสิ่งที่พยายามช่วยคุณ
หนึ่งในคุณสมบัติใหม่ที่ยิ่งใหญ่ที่เขากล่าวถึงคือเสียงชีวภาพซึ่งเสียงของคุณจะแทนที่รหัสผ่าน เขาพูดคุยเกี่ยวกับวิธีการที่ บริษัท เช่น ING ในยุโรปกำลังพัฒนาตัวแทนที่ไม่เพียง แต่ใช้การรู้จำเสียงและการประมวลผลภาษาธรรมชาติ แต่ยังเริ่มใช้เสียงเพื่อจดจำผู้ที่โทรมาด้วย เขาบอกว่ามันปลอดภัยและเป็นธรรมชาติมากกว่ารหัสผ่านแบบดั้งเดิม
ในขณะที่การศึกษาเมื่อเร็ว ๆ นี้มีความกังวลว่าการบันทึกเสียงอาจหลอกระบบดังกล่าวได้ Nuance ตั้งข้อสังเกตว่าเทคโนโลยีของวันนี้มีคุณสมบัติที่มีจุดประสงค์เพื่อยกระดับความผิดปกติจากเสียงที่บันทึกไว้และชี้ไปที่การศึกษาอื่น ๆ นอกจากนี้เขายังกล่าวอีกว่านักออกแบบสามารถใช้ระดับเสียงชีวภาพที่แตกต่างกันสำหรับฟังก์ชั่นที่แตกต่างกันเช่นการใช้การจดจำง่ายเพื่อตรวจสอบยอดเงินในบัญชีหรือขอให้คุณย้อนลำดับคำซ้ำเพื่อโอนเงินจำนวนมาก
เสียงชีวภาพดูเหมือนจะดึงดูดความสนใจได้อย่างแน่นอน ในงาน Gartner Symposium ของสัปดาห์ที่แล้วเซสชั่นเกี่ยวกับ "คดีลูกค้าที่น่าสนใจ" ในบริการด้านการเงินรวมถึงแอพ Citibank ที่ใช้คุณสมบัตินี้
MyWave มีผู้ช่วยที่เรียกว่า Frank ซึ่งมีวัตถุประสงค์เพื่อเปิดใช้งานโดยหลายธุรกิจเพื่อให้คุณสามารถโต้ตอบกับพวกเขาในแบบที่เป็นบทสนทนามากกว่าที่จะให้แต่ละธุรกิจพัฒนาตนเอง การใช้งานครั้งแรก ได้แก่ ธนาคารนิวซีแลนด์และแอปที่ชื่อว่า Saveawatt ออกแบบมาเพื่อช่วยคุณเลือกผู้ให้บริการไฟฟ้าของคุณ
CEO Geraldine McBride อธิบายว่า บริษัท กำลังพยายามสร้างผู้ช่วยที่เชื่อมช่องว่างระหว่างลูกค้าและแอพบริการด้วยสิ่งที่เรียกว่า "ความสัมพันธ์ที่จัดการโดยลูกค้า" หรือ CMR ซึ่งเป็นแอปพลิเคชัน CRM แบบดั้งเดิม ความแตกต่างที่สำคัญอย่างหนึ่งของเธอคือการที่ลูกค้ารับผิดชอบข้อมูลทั้งหมดของเขาหรือเธอมากกว่าธุรกิจ
บริษัท ใหม่ที่ค่อนข้างใหม่ Expect Labs มีผลิตภัณฑ์ที่ชื่อว่า MindMeld ซึ่งทำงานเป็นแบ็กเอนด์ไปยัง บริษัท หลายแห่งที่ต้องการนำเสนออินเทอร์เฟซเสียงเพื่อแทนที่อินเทอร์เฟซแบบดั้งเดิมและจัดการกับคำถามและคำตอบ สามารถใช้กับแอพพลิเคชั่นที่หลากหลายเช่นดูรายการทีวีโดยเพียงแค่ถามชื่อและมีระบบสืบค้นหลายระบบ (Fire's ของ Amazon มีคุณสมบัติบางอย่าง แต่ไม่รวมเข้ากับกล่องรับสัญญาณเคเบิลของคุณในขณะที่หนึ่งในนักลงทุนใน Expect Labs คือ บริษัท เคเบิล Liberty Global)
CEO Tim Tuttle อธิบายว่า MindMeld มีแนวโน้มที่จะใช้การรู้จำเสียงที่มีอยู่แล้วในอุปกรณ์ส่วนใหญ่และแทนที่จะเน้นที่การทำความเข้าใจภาษาธรรมชาติและสร้างกราฟความรู้ของข้อมูลที่มีอยู่ เขากล่าวว่า บริษัท กำลังพยายามปรับขนาดระบบเพื่อรวมข้อมูลเพิ่มเติมจากหลาย ๆ แหล่งและแยกย่อยลำดับชั้นของข้อมูลประเภทต่างๆที่เป็นส่วนหนึ่งของระบบดังกล่าวส่วนใหญ่ การเข้าใจคำถามที่แท้จริงหมายถึงความสามารถในการเข้าใจเจตนาในหลากหลายหมวดหมู่เขากล่าว
สิ่งหนึ่งที่ฉันได้ยินจากผู้เข้าร่วมจำนวนหนึ่งคือสถิติที่แนะนำว่าขณะนี้ประมาณ 10 เปอร์เซ็นต์ของการค้นหาเว็บทั้งหมดดำเนินการผ่านตัวแทนข่าวกรอง (ผู้บุกเบิก AI แอนดรูอึ้งกล่าวว่านี่เป็นเรื่องจริงสำหรับการค้นหาด้วยเสียงที่ Baidu เมื่อปีที่แล้วและหลายคนบอกว่านี่เป็นความจริงที่ Google ด้วยเช่นกัน แต่ฉันไม่เคยได้ยินคำยืนยันใด ๆ เลย)
มองไปข้างหน้ามิลเลอร์ Opus Research กล่าวว่ายังมีงานอีกมากที่ต้องทำ ความแม่นยำขั้นพื้นฐานของระบบมีพื้นที่มากมายสำหรับการปรับปรุงโดยเฉพาะอย่างยิ่งในการย้ายจากสิ่งที่คุณพูดกับสิ่งที่คุณหมายถึงสิ่งที่ต้องทำผลที่ตามมา เขากล่าวถึงการพูดคุยจากสตีเฟ่นฮูเวอร์ซีอีโอของซีร็อกซ์ PARC ซึ่งกล่าวว่าระบบในปัจจุบันมีความแม่นยำสูงถึง 90 เปอร์เซ็นต์ในการทำความเข้าใจสิ่งที่เราหมายถึง แต่ 10 เปอร์เซ็นต์ยังคงเป็นปัญหาเพราะมันเป็นสิ่งที่คนส่วนใหญ่จำ ระบบ และมิลเลอร์กล่าวว่ามีที่ว่างสำหรับการตั้งค่าส่วนบุคคลที่ดีกว่าเพราะหากระบบรู้ว่าใครกำลังพูดถึงมันจะให้ผลลัพธ์ที่ดีกว่า ตัวอย่างเช่นเขาตั้งข้อสังเกตว่า Facebook รู้ว่าใครกำลังใช้ระบบเพราะคุณเข้าสู่ระบบ และกล่าวว่าการทำสิ่งนี้กับตัวแทนมากขึ้นจะกลายเป็นเรื่องสำคัญมากขึ้น
เป็นหมวดหมู่ที่น่าสนใจและฉันคาดหวังว่าเราทุกคนจะใช้เวลามากขึ้นในการพูดคุยกับโทรศัพท์และคอมพิวเตอร์ของเราและโต้ตอบกับตัวแทนที่ไม่ใช่มนุษย์ ฉันพบว่าหนึ่งในแนวโน้มที่น่าสนใจที่สุดในการคำนวณวันนี้