Book Summary: Designing Machine Learning Systems ตอนที่ 1/2

 

Book Summary: Designing Machine Learning Systems ตอนที่ 1/2

หนังสือที่ CIO, MIS, ML Engineer และ Data Scientist ควรมี
เพื่อ “คิดใหม่ บริหารใหม่” เพราะ AI ไม่ได้เริ่มจากลอจิก แต่เริ่มจากเดต้า

 

นี่คือ หนังสือที่มหาวิทยาลัยสแตนฟอร์ดใช้ประกอบการสอนวิชา CS 329S: Machine Learning Systems Design ..เป็นจุดเริ่มต้นที่ดึงดูดให้ผมสนใจหนังสือเล่มนี้

สิ่งที่เคยเรียนรู้จากอาจารย์ Andrew Ng เมื่อ 3 ปีก่อน ไม่ได้เกี่ยวข้องกับการ “บริหารโปรเจกต์” เป็นเนื้อหาเชิงทฤษฎีคณิตศาสตร์ เมตริกซ์ สถิติ และเทคนิคการปรับจูนอัลกอริทึม (ขออนุญาต แนะนำให้ทดลองเรียนฟรีคอร์สออนไลน์ AI ของอาจารย์แอนดรู อึ๊ง https://www.coursera.org/specializations/deep-learning)

แต่..การทำงานจริง โลกธุรกิจ วิธีบริหารจัดการโปรเจกต์ AI ไม่ได้เน้นแค่อัลกอริทึม แต่ยังเน้นประสบการณ์การใช้ของยูสเซอร์ ความเร็วในการตอบสนอง ความปลอดภัยของข้อมูลส่วนตัว เป้าหมายทางธุรกิจ ค่าใช้จ่าย การบริหารทีมงาน การปฏิบัติตามกฎหมายและเงื่อนไขสังคม

 

..รู้แค่โค้ดและเดต้า ไม่เพียงพอสำหรับการบริหารโปรเจกต์

 

การบริหารโปรเจกต์ AI ไม่ง่าย ไม่ใช่ทำเสร็จแล้ว ก็พักเหนื่อยได้เหมือนการเขียนโค้ดแบบเดิม โปรเจกต์ AI เมื่อพัฒนาเสร็จแล้วนำไปใช้ …นั่นคือจุดเริ่มต้นของงานที่แท้จริง ที่ไม่มีวันหยุดพัก (Iterative Process)

ข้อมูลเปลี่ยนทุกวินาทีและเพิ่มมากขึ้นตามจำนวนยูสเซอร์ โมเดลต้องอัพเดทตลอด เมื่อก่อนเสิร์ชค้นคำว่า อู่ฮั่น อาจหมายถึงชื่อเมืองท่องเที่ยวของจีน ต่อมาอาจจะหมายถึงเมืองที่ถูกโยนบาปว่าเป็นจุดกำเนิดโควิด เดต้าเปลี่ยนทุกวัน บริบทเปลี่ยนทุกวินาที โมเดล AI ที่เน้นเรื่อง user experience ต้องเปลี่ยนตามให้ทัน ซึ่งเรื่องแบบนี้ โค้ดดิ้งแบบเก่าอาจไม่เน้นมาก

AI ไม่ได้เริ่มจากโค้ดไปหาเดต้า แต่…เริ่มจากเดต้า แล้วไปหาโค้ด เวลาจะเลือกใช้โมเดล ผู้ออกแบบระบบต้องคิดและตีความเดต้าให้ชัดก่อน จึงจะรู้ว่าจะใช้โมเดลชนิดไหน ใช้กี่โมเดล จะใช้วิธี regression, classification, clustering จะใช้แบบ supervised, unsupervised หรือ reinforcement แล้วค่อยลงลึกไปอีกขั้นว่าจะใช้อัลกอริทึมแบบไหนดี Naïve Bayes Classifier, K-Means Clustering, TD Learning หรือจะใช้เฟรมเวิร์ค, Transformer, หรือ GAN เวอร์ชั่นไหน …จึงจะตอบโจทย์ทางธุรกิจและตอบสนองลูกค้าได้ดีที่สุด พัฒนาได้เร็วสุด ประหยัดสุด …ไม่ใช่เน้นแค่เรื่อง “เปอร์เซนต์ความแม่นยำ” เพราะธุรกิจไม่ได้เน้นประกวดแข่งสุดยอดอัลกอริทึม เหมือนงานวิจัยในมหาวิทยาลัย

 

ประเภทของแมชชีนเลิร์นนิ่ง

 

และนี่คือหลักคิดบางส่วนที่ผมได้จากหนังสือเล่มนี้ Designing Machine Learning Systems ของ Chip Huyen ซึ่งเป็นอาจารย์มหาวิทยาลัยสแตนฟอร์ด และเป็นหนึ่งในหนังสือขายดีซึ่งระบบ AI (recommender system) ของ Amazon แนะนำให้อ่าน

credit: ภาพจาก IG @data_science_school

 

หนังสือเล่มนี้แบ่งออกเป็น 11 บท เริ่มจากความรู้ทั่วไปเกี่ยวกับกลไก AI, Data Engineering, Feature Engineering, จากนั้นเข้าสู่เนื้อหาด้านบริหารจัดการ เรื่องการปรับใช้, โครงสร้างพื้นฐานและเครื่องมือสำหรับ MLOps, หลักคิดเรื่องประสบการณ์ยูสเซอร์, หลักจริยธรรมข้อมูลและความเป็นส่วนตัวของยูสเซอร์ เล่มนี้ไม่ลงลึกเรื่องทฤษฎี โค้ด และอัลกอริทึม อาจารย์ชิปเห็นว่ามีหนังสือและคอร์สในมหาวิทยาลัยทั้งออนไลน์ออนไซต์ในเรื่องโค้ดและอัลกอริทึมอยู่มากแล้ว จึงเน้นเรื่องหลักคิดเพื่อ “บริหารโปรเจกต์” มากกว่า ทั้งนี้เพราะเทคโนโลยีเปลี่ยนเร็ว เครื่องมือ เฟรมเวิร์กและอัลกอริทึมเก่ามักจะหายไป เครื่องมือใหม่เกิดใหม่แทนที่ตลอดเวลา แต่หลักคิดหลักการและแนวทางแก้ปัญหาไม่ค่อยเปลี่ยน

หนังสือเล่มนี้ (ฉบับภาษาไทยมีจำหน่ายแล้วที่ร้านซีเอ็ด นายอินทร์ ราคาน่าจะถูกกว่าต่างประเทศครึ่งหนึ่ง) แนะนำขั้นตอนและวิธีปรับใช้ (deployment) วิธีประเมินผลและเลือกใช้โมเดล AI ซึ่งมักจะเกิดขึ้นพร้อมกันหลายตัว เช่น มีทั้งโมเดลแชมเปี้ยนและโมเดลผู้ท้าชิงอีกหลายๆ ตัวให้เลือกในเวลาเดียวกัน นอกจากนี้ยังแนะวิธีประเมินและเลือกใช้เครื่องมือใหม่ๆ ที่เหมาะสมสำหรับโปรเจกต์ AI หนึ่งๆ ซึ่งแม้ว่าโจทย์ธุรกิจจะเหมือนกัน แต่อาจได้คำตอบและโมเดล AI ที่ไม่เหมือนกัน

คิดใหม่ บริหารใหม่…เป็นคำที่ผมอยากแนะนำ CIO, MIS และผู้บริหารโครงการไอทียุคใหม่ ที่เกี่ยวข้องกับโปรเจกต์ AI

วิธีคิดและบริหารโปรเจกต์ไอทีแบบดั้งเดิมที่เป็น logic-based coding อาจใช้ได้ไม่มากนัก อาจทำให้การประเมินเนื้องาน ขนาดทีมงาน ขนาดข้อมูล ระบบคลาวด์ และค่าใช้จ่ายของโครงการผิดเพี้ยนไป ซึ่งอาจทำให้โปรเจกต์ล้มเหลวเพราะหมดทุน หมดใจไปก่อนเวลาอันควร

สำหรับตอนที่ 2 ..ตอนจบ ผมจะสรุปหนังสือเล่มนี้..ทีละบท

เพื่อให้เห็นวิธีคิดเชิงบริหารโปรเจกต์ไอทีแบบใหม่ เช่น ข้อมูลเปลี่ยนทุกวินาที แล้วโค้ดต้องเปลี่ยนทุกวินาทีหรือไม่ ? แล้วจะเปลี่ยนโค้ดอย่างไรในขณะที่โมเดลกำลังทำงานอยู่ ?

 

*********

ติดตามบทความ AI.Neuro.Pal ได้ที่

Facebook: www.facebook.com/ai.neuro.pal

Twitter: https://twitter.com/AiNuero

Blogger: https://aineuro9.blogspot.com

Medium: https://medium.com/@AiNeuroPal

ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

สรุปหนังสือ AI and Machine Learning for Coders แต่งโดย “หัวหน้าทีมวิจัย AI” ของ Google และหนึ่งในผู้คิดค้น TensorFlow

DeepMind ของ Google เตรียม "สู้กลับ" ด้วย Sparrow ...ChatGPT เวอร์ชันที่ดีกว่าและเป็นผู้ใหญ่มากกว่า

กูเกิ้ล ลดพนักงาน 1.2 หมื่น แล้วดึงผู้ก่อตั้ง 2 คนกลับมาฉุกเฉิน เพื่อต่อกรกับ ChatGPT จากไมโครซอฟท์-โอเพ่นเอไอ