เปิดเบื้องหลัง การวิเคราะห์ Mobility Data จากข้อมูลนับหมื่นล้านชุดต่อยอดการใช้งานเพื่อการพัฒนาสังคม

“โครงการฯ นี้เกิดขึ้นมาจากความเชื่อในพลังของดาต้า ที่ผ่านมา เราเห็นยูสเคสจากใช้ประโยชน์จากดาต้าเชิงพาณิชย์อย่างแพร่หลาย แต่จะดีกว่าไหม ถ้าเราสามารถดึงผู้เชี่ยวชาญในสาขาต่างๆ มาจับมือกันเพื่อแก้ไขปัญหาสังคม และโครงการฯ นี้จึงเกิดขึ้นจากการนั่งคุยเพียง 1 ชั่วโมงระหว่างดีแทค อ.อั๋น (ผศ.ดร.ณัฐพงศ์ พันธ์น้อย) จากคณะสถาปัตย์ จุฬา และคุณโจ้ (ธิติพงษ์ เหลืองอรุณเลิศ ซีอีโอของบุญมีแล็บ)” อรอุมา ฤกษ์พัฒนาพิพัฒน์ ผู้อำนวยอาวุโส สายงานสื่อสารองค์กรและความยั่งยืนของดีแทค เล่าถึงที่มาที่ไปของโครงการศึกษารูปแบบการเคลื่อนที่และการกระจุกตัวของนักท่องเที่ยวไทยในสถานการณ์การแพร่ระบาดของโรคโควิด-19 ผ่านข้อมูลการเคลื่อนที่ (mobility data)

dtac

เธออธิบายต่อว่า เธอเชื่อว่าอุตสาหกรรมโทรคมนาคมถือเป็น enabler ที่สำคัญ เพราะเป็นหนึ่งในไม่กี่อุตสาหกรรมที่มีฐานข้อมูลลูกค้าอยู่ในความดูแลขนาดมหาศาล จากเดิมที่มีการพูดคุยกันในการทำวิจัยในระดับจังหวัด แต่เมื่อขยายผลให้เห็นถึงศักยภาพของ mobility data ผู้เกี่ยวข้องทั้ง 3 ฝ่าย จึงได้เห็นชอบในการวิจัยระดับประเทศ

ข้อมูลมหาศาลนับหมื่นล้านชุด

ทว่ากว่าโปรเจกต์นี้จะเกิดขึ้นไม่ใช่เรื่องง่ายและกินเวลาทั้งสิ้นเกือบ 2 ปี โดยขั้นตอนที่ใช้เวลายาวนานที่สุดคือ การพิจารณาความเสี่ยงจากการใช้ประโยชน์ของข้อมูลเพื่อการวิจัยจากผู้มีส่วนเกี่ยวข้องที่กินเวลาราว 1 ปีครึ่ง โดยประกอบด้วยขั้นตอนการสอบทานธุรกิจ (Business Partner Due Diligence) ลงนามเห็นชอบในสัญญารักษาความลับ (Non-disclosure agreement) หนังสือบันทึกข้อตกลงระหว่างองค์กร (MoU) และสัญญาการเก็บ ใช้และประมวลผลข้อมูล (Data Processing Agreement) นอกจากนี้ ยังต้องผ่านการประเมินผลกระทบด้านการคุ้มครองข้อมูลส่วนบุคคลจากคณะกรรมการภายใน (Dara Privacy Risks & Impact Assessment) อีกด้วย เนื่องจากจัดเป็นประเด็นอ่อนไหว เกี่ยวข้องกับความเป็นส่วนตัวของลูกค้า ทั้งนี้ ดีแทคจึงต้องตรวจสอบให้มั่นใจว่าโครงการนี้เป็นชุดข้อมูลที่ไม่สามารถระบุตัวตนของผู้ใช้งานได้ทั้งทางตรงและทางอ้อม ภายใต้การกำกับและดูแลนโยบายข้อมูลส่วนบุคคลและความปลอดภัยทางไซเบอร์ที่เข้มงวดของดีแทค

อย่างไรก็ตาม ด้วยความเชื่ออันแรงกล้าของทีมงาน ทุกฝ่ายได้ฝ่าฟันอุปสรรคนานัปการ โดยปฏิบัติตามเงื่อนไขที่ว่า ข้อมูลจะเป็นแบบไม่เฉพาะเจาะจงและถูกทำให้ไม่สามารถระบุตัวตนได้ (Aggregate and anonymized data) ชุดข้อมูลที่ทำการวิจัยเป็นชุดข้อมูลที่ได้รับความยินยอมจากลูกค้าแล้วเท่านั้น ที่สำคัญ การวิเคราะห์ข้อมูลจะต้องดำเนินการในสถานที่แบบปิด ไม่สามารถเข้าถึงอินเทอร์เน็ตได้ โดยดีแทคได้อำนวยความสะดวกด้านสถานที่ไว้ที่ชั้น 31 ที่ดีแทคเฮาส์

dtac

วรวิมล ศรีนุต ผู้อำนวยการฝ่ายบริหารคุณค่าลูกค้าของดีแทค อีกหนึ่งบุคคลสำคัญที่ทำหน้าที่สร้างความมั่นใจว่าข้อมูลที่ทำการวิเคราะห์นั้นอยู่ภายใต้นโยบายข้อมูลส่วนบุคคลขั้นสูงสุด เล่าว่า ข้อมูลที่ถูกนำไปวิเคราะห์นี้ หรือที่เรียกว่า mobility data สามารถระบุช่วงเวลาการใช้งาน รูปแบบการใช้งาน รวมถึงตำแหน่งของการใช้งาน ซึ่งก่อนจะนำไปวิเคราะห์ ดีแทคได้ทำให้ข้อมูลไม่สามารถระบุตัวตน ผ่านเทคนิค Data anonymization (One-way Hashing with SHA-256) ทำให้ข้อมูลระหว่างเดือนมิถุนายน 2563 ถึงตุลาคม 2564 ที่มีขนาดนับ “หมื่นล้านชุด” ถูกจัดทำให้อยู่ในระดับ “ตำบล” เมื่อทำการนิรนามข้อมูลและสุ่มกลุ่มตัวอย่างให้อยู่ปริมาณที่สามารถดำเนินการวิเคราะห์ได้อย่างมีประสิทธิภาพแล้ว จึงนำข้อมูลส่งต่อนักวิจัยผ่านโครงข่ายส่วนตัว (Private network) เพื่อนำไปวิเคราะห์ต่อไป

ความท้าทายในการจัดการข้อมูลขนาดใหญ่

ผศ.ดร.ภูริพันธุ์ รุจิขจร ผู้ร่วมก่อตั้ง และ รพี สุวีรานนท์ CTO ของ Boonmee Lab เล่าว่า หลังจากได้ข้อมูลมาแล้ว ทาง อ.อั๋น ของคณะสถาปัตย์ฯ จุฬา จะทำหน้าที่เป็น Domain expert หรือผู้เชี่ยวชาญในสาขานั้นๆ โดยจะเป็นผู้ตั้งชุดคำถามและแนวทางการวิเคราะห์ข้อมูลขึ้นมาก่อน จากนั้นทาง Boonmee Lab จึงพิจารณาถึงการจัดการข้อมูลและหาความเป็นไปได้ในการตอบคำถามเหล่านั้น

ด้วยลักษณะเฉพาะของ Mobility data ที่แสดงถึงปริมาณการกระจุกตัวของการเดินทางแต่ละรูปแบบในแต่ละพื้นที่และในแต่ละช่วงเวลา ทำให้ข้อมูลที่ได้รับมาจากดีแทคมีความลื่นไหลในตัวเองสูง สามารถสร้างวิธีการจัดการข้อมูลได้หลากหลายรูปแบบ นั่นจึงทำให้ทีม Boonmee Lab และอ.อั๋นต้องทำงานร่วมกันอย่างใกล้ชิดเพื่อร่วมกันกำหนดนิยามจากการทบทวนวรรณกรรม ขั้นตอนการวิเคราะห์  การกำหนดดัชนีชี้วัด  และการตีความผลการวิเคราะห์ เพื่อให้สามารถตอบคำถามที่ต้องการได้  ตัวอย่างเช่น นิยามของการเดินทางท่องเที่ยวจากข้อมูลชุดนี้ คือ การเดินทางออกจากจังหวัดที่เป็นถิ่นที่อยู่และสถานที่ทำงานไปสู่จังหวัดอื่นในวันหยุด เราจึงต้องมากำหนดเงื่อนไขในเชิงพื้นที่และเวลาเพื่อคัดเลือกเฉพาะข้อมูลการเดินทาง (ทริป) ที่ตรงกับนิยามการเดินทางท่องเที่ยว เพื่อให้มั่นใจว่าข้อมูลที่ใช้นั้นสะท้อนให้เห็นถึงการกระจุกตัวของการเดินทางท่องเที่ยวในพื้นที่นั้นจริงๆ  ประกอบกับการวิเคราะห์ข้อมูลการกระจุกตัวเรากำหนดรายละเอียดลงไปถึงการกระจุกตัวของการเดินทางในระดับตำบล ซึ่งทำให้ทีม Boonmee Lab ต้องคิดหาวิธีการวิเคราะห์ข้อมูลขนาดใหญ่ที่มีประสิทธิภาพมากที่สุด

dtac

การวิเคราะห์ในครั้งนี้มีระเบียบวิธีที่ต่างออกไปจากการใช้วิธีสำรวจการเดินทางของนักท่องเที่ยวโดยแบบสอบถามและการสัมภาษณ์ซึ่งเป็นการรวบรวมข้อมูลย้อนหลังโดยอาศัยข้อมูลจากความทรงจำของนักท่องเที่ยว เนื่องจากเป็นการวิเคราะห์ Mobility data จะสะท้อนรูปแบบและพฤติกรรมการเดินทางที่เกิดขึ้นจริงในแต่ละพื้นที่ นอกจากนั้น การวิเคราะห์ข้อมูลจึงสามารถดำเนินการได้หลากหลายรูปแบบจากลักษณะของคำถามที่ต้องการรู้และรูปแบบข้อมูลที่มีอยู่

“ในการทำงาน ทีม Boonmee Lab จะต้องวางแผนการทำงานที่มีความยืดหยุ่น เพื่อสามารถปรับเปลี่ยนวิธีการวิเคราะห์ข้อมูลให้เป็นไปตามนิยาม คำถาม และตัวแปรต่างๆ ได้อย่างเหมาะสม รวดเร็ว และถูกต้อง” ระพี กล่าว

ผศ.ดร.ภูริพันธุ์ อธิบายเสริมว่า ในการจัดการข้อมูลเพื่อใช้ในการวิเคราะห์นั้น ทาง Boonmee Lab จะไม่รู้ข้อมูลส่วนบุคคลของผู้ใช้งานเลย จะรับรู้เพียงแค่ข้อมูลการเดินทางที่จะแสดงจุดเริ่มต้นและจุดปลายทางของแต่ละชุดข้อมูลเท่านั้น  ทั้งนี้ ข้อมูลที่ได้รับจากดีแทคเกิดจากการ “สุ่ม” กลุ่มตัวอย่างคิดเป็นสัดส่วนร้อยละ 10 ของบัญชีหมายเลขโทรศัพท์มือถือในเครือข่ายของดีแทคที่อนุญาตให้สามารถใช้ในการวิเคราะห์ข้อมูลได้ และเป็นบัญชีหมายเลขที่มีรูปแบบการเดินทางตรงตามนิยามการท่องเที่ยวที่กำหนดไว้ ซึ่งนับได้ว่าข้อมูลที่นำมาใช้ในโครงการมีจำนวนมากเพียงพอที่จะเป็น “กลุ่มตัวแทน” ของการเดินทางท่องเที่ยวตามหลักสถิติได้เป็นอย่างดี

Mobility data เป็นข้อมูลแบบ Hierarchy  กล่าวคือ เป็นข้อมูลที่มีลำดับชั้นและสามารถวิเคราะห์ได้หลากหลายรูปแบบ โดยมีตัวแปรสำคัญเป็นเรื่องของสถานที่และเวลา  ในเชิงสถานที่สามารถประมวลผลข้อมูลได้ทั้งในระดับภาค ระดับจังหวัด จนถึงระดับตำบล  ขณะที่มิติด้านเวลาสามารถแบ่งข้อมูลออกเป็นช่วงเวลากลางวันและกลางคืน หรือช่วงเช้า บ่าย เย็น และค่ำในแต่ละวันก็ได้   Mobility data มีความแตกต่างจากข้อมูลที่เคยผ่านมือของ Boonmee Lab มาในอดีต ทั้งในแง่ปริมาณของข้อมูลที่มีขนาดใหญ่มาก รวมถึงการเป็นข้อมูลที่บันทึกสถานการณ์จริงโดยอัตโนมัติ  ทั้งนี้ Mobility data นับเป็นข้อมูลที่มีความแม่นยำ สามารถจัดเก็บได้บ่อย และช่วยให้เข้าใจถึงรูปแบบการเดินทางได้เป็นอย่างดี  ทีม Boonmee Lab จึงนำ Mobility data มาจัดการให้อยู่ในรูปแบบที่ทีมนักวิจัยจากคณะสถาปัตยกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัยสามารถนำไปใช้วิเคราะห์ในเชิงพื้นที่ต่อได้ง่าย โดยจัดทำตารางแสดงข้อมูลที่บ่งชี้ถึงปริมาณการกระจุกตัวของการเดินทางแต่ละรูปแบบในแต่ละพื้นที่ตามช่วงเวลา

ระพี กล่าวเสริมว่า แม้การจัดการ Mobility data จะมีความซับซ้อนสูง แต่ทีมงานรู้สึกสนุกไปกับขั้นตอนการดำเนินการอย่างมาก เนื่องจากข้อมูลชุดนี้ช่วยให้เรามองเห็นรูปแบบของการเดินทางท่องเที่ยวในแต่ละพื้นที่ ซึ่งข้อมูลสะท้อนความหมายที่แตกต่างกันเมื่อเราเปลี่ยนแปลงตัวแปรในการวิเคราะห์ข้อมูล ไม่ว่าจะเป็นเวลา สถานที่ หรือรูปแบบการเดินทาง

dtac

ศักยภาพที่ซ่อนอยู่ของ Mobility data

ด้าน ผศ.ดร.ณัฐพงศ์ พันธ์น้อย อาจารย์ประจำภาควิชาการวางแผนภาคและเมือง และดำรงตำแหน่งเป็นรองผู้อำนวยการหน่วยปฏิบัติการวิจัยด้านการออกแบบเพื่อพัฒนาเศรษฐกิจสร้างสรรค์ (DCE) คณะสถาปัตยกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย อธิบายต่อว่า ทีมนักวิจัยจาก DCE ต้องทำการบ้านอย่างหนักและต้องประสานงานร่วมกับทีม Boonmee Lab อย่างใกล้ชิดเพื่อทำความเข้าใจลักษณะของข้อมูลและพิจารณาความเป็นไปได้ในการวิเคราะห์ค้นหาคำตอบภายใต้มาตรการการคุ้มครองข้อมูลส่วนบุคคล ในช่วงแรกทีมนักวิจัยได้จัดทำชุดคำถามที่น่าจะเป็นประโยชน์ต่อการพัฒนาการท่องเที่ยวและสามารถวิเคราะห์ได้จากข้อมูล Mobility data  จากนั้นจึงนำข้อมูลที่ได้รับจากทีม Boonmee Lab มาวิเคราะห์ต่อโดย
ระบบภูมิสารสนเทศภูมิศาสตร์ (Geographic Information System; GIS) เพื่อทำให้เห็นข้อมูลการกระจุกตัวของการเดินทางท่องเที่ยวในเชิงพื้นที่อย่างชัดเจนมากยิ่งขึ้น  ขั้นตอนนี้เรียกว่า scanning เพื่อคัดกรองว่าข้อมูลที่มีอยู่ทำให้เราเข้าใจสถานการณ์การท่องเที่ยวในประเด็นได้บ้าง  เมื่อวิเคราะห์ข้อมูลจนได้ผลที่ชัดเจนในแต่ละมิติทั้งในด้านรูปแบบการเดินทางและปริมาณการกระจุกตัวในแต่ละสถานที่และช่วงเวลาแล้ว

ทีมนักวิจัยจากจุฬาลงกรณ์มหาวิทยาลัยจึงนำผลการวิเคราะห์มาพิจารณาค้นหาความหมาย (connect the dots) เพื่อพิจารณาถึงแนวทางการพัฒนาการท่องเที่ยวที่เหมาะสมกับในแต่ละพื้นที่

รองผู้อำนวยการหน่วยปฏิบัติการวิจัยด้านการออกแบบเพื่อพัฒนาเศรษฐกิจสร้างสรรค์อธิบายถึงความท้าทายในการทำงานว่า “ประเด็นสำคัญของการทำงานในขั้นตอนนี้ คือ ผู้วิจัยจะต้องเข้าใจทั้งลักษณะของ Mobility data และแนวทางการนำข้อมูลไปใช้ประโยชน์ จึงจะสามารถวางกรอบการวิเคราะห์ที่ชี้ให้เห็นศักยภาพและข้อจำกัดของการพัฒนาการท่องเที่ยวในแต่ละพื้นที่ได้อย่างชัดเจน”

ผศ.ดร.ณัฐพงศ์ อธิบายว่า Mobility data เปิดโอกาสให้เราทำความเข้าใจสถานการณ์ด้านการท่องเที่ยวได้อย่างละเอียด ชัดเจน และบูรณาการมากยิ่งขึ้น  เราสามารถทราบถึงการกระจุกตัวของการเดินทางท่องเที่ยวทั้งในรูปแบบค้างคืนและไปกลับในแต่ละพื้นที่ได้อย่างชัดเจน โดยหน่วยการวิเคราะห์เชิงพื้นที่สามารถลงรายละเอียดได้ถึงระดับตำบล ในด้านช่วงเวลาเราสามารถทำความเข้าใจการเดินทางของนักท่องเที่ยวได้ถึงระดับรายชั่วโมงในแต่ละวัน  ศักยภาพของ Mobility data ช่วยให้เราประเมินสถานการณ์และนโยบายด้านการท่องเที่ยวได้อย่างละเอียดและชัดเจนยิ่งขึ้น ตัวอย่างเช่น เราสามารถทราบได้ถึงขนาดที่ว่างานเทศกาลที่จัดขึ้นในพื้นที่หนึ่งสามารถทำให้เกิดการท่องเที่ยวแบบค้างคืนได้เพิ่มขึ้นมากน้อยเพียงใด หรือจังหวัดใดบ้างที่นักท่องเที่ยวเดินทางไปเที่ยวอย่างต่อเนื่องกันในการเดินทางหนึ่งครั้ง  นอกจากนั้น ลักษณะเฉพาะของ Mobility data ที่มีตัวแปรประกอบด้วยรูปแบบการเดินทาง ปริมาณการกระจุกตัว ช่วงเวลา และสถานที่  ทำให้เราสามารถใช้ความคิดสร้างสรรค์ในการตั้งคำถามและคิดหาวิธีการวิเคราะห์ข้อมูลเพื่อทำความเข้าใจสถานการณ์การท่องเที่ยวในแต่ละพื้นที่ได้อย่างหลากหลาย  ซึ่งจะเป็นประโยชน์ต่อหน่วยงานภาครัฐ ภาคเอกชน ชุมชน และสถาบันการศึกษาในการวางแผนการพัฒนาการท่องเที่ยว สินค้า และการบริการในแต่ละท้องถิ่นอย่างมีประสิทธิภาพ

“ด้วยศักยภาพของ Mobility data ทำให้ดีแทค Boonmee Lab และจุฬาลงกรณ์มหาวิทยาลัยตัดสินใจร่วมกันถึงการเผยแพร่ผลการศึกษาผ่านโครงการ Tapping the Untapped ซึ่งเป็นการนำเสนอมุมมองของการใช้ข้อมูลที่เราไม่เคยใช้งานให้เป็นประโยชน์มาก่อน เพื่อขยายโอกาสในการส่งเสริมการท่องเที่ยวในจังหวัดเมืองรอง เพื่อกระตุ้นการฟื้นตัวทางเศรษฐกิจและส่งเสริมการพัฒนาสังคมอย่างยั่งยืนไปยังท้องถิ่นต่างๆ ในประเทศไทย”  ผศ.ดร.ณัฐพงศ์ กล่าว

โมเดล Co-Lab สู่การใช้ Mobility data เพื่อการพัฒนาสังคม

ผศ.ดร.ณัฐพงศ์ พันธ์น้อย เล่าเสริมถึงโมเดล Co-Lab ว่า การร่วมทำงานกันระหว่างบริษัทดีแทค ทีม Boonmee Lab และจุฬาลงกรณ์มหาวิทยาลัยในการวิเคราะห์ Mobility data เพื่อทำความเข้าใจสถานการณ์ด้านการท่องเที่ยวในครั้งนี้ชี้ให้เห็นว่าการนำ Mobility data ไปใช้ในการออกแบบนโยบายการพัฒนาสังคมจำเป็นอย่างยิ่งที่ต้องได้รับการสนับสนุนด้านข้อมูลและสถานที่ทำการวิเคราะห์จากบริษัทโทรคมนาคม รวมถึงต้องการการร่วมมือกันระหว่างบุคคลากรด้านการวิเคราะห์ข้อมูล ผู้เชี่ยวชาญด้านการออกแบบนโยบาย และที่สำคัญ คือ หน่วยงานภาครัฐและภาคประชาสังคมที่ต้องการนำข้อมูลไปใช้ประโยชน์เพื่อการแก้ไขปัญหาและพัฒนาสังคมให้น่าอยู่มากยิ่งขึ้น  การร่วมมือระหว่างภาคส่วนที่เกี่ยวข้องอย่างสร้างสรรค์เพื่อทำความเข้าใจสถานการณ์และออกแบบแนวทางการพัฒนาเป็นกลไกสำคัญในการผลักดันให้การใช้ Mobility data นำไปสู่การออกแบบนวัตกรรมเพื่อการพัฒนาสังคมอย่างยั่งยืน

อรอุมา เล่าว่า โมเดล Co-lab นี้ สามารถนำมาใช้กับปัญหาใหญ่อื่นๆ ที่ Mobility data สามารถเผยให้เห็น insights ที่สำคัญ เช่น การแก้ไขปัญหาด้านการจราจร การให้บริการสาธารณสุข การพัฒนาพื้นที่สาธารณะ การป้องกันโรคระบาด การบริหารจัดการในช่วงเกิดภัยพิบัติ เป็นต้น  การร่วมงานกันครั้งนี้นำไปสู่การส่งเสริมฐานคิดใหม่ของการออกแบบนโยบายสาธารณะผ่านบิ๊กดาต้า เพื่อเพิ่มประสิทธิภาพและเปลี่ยนมุมมองการจัดทำนโยบายสาธารณะในรูปแบบใหม่ โดย Co-lab ช่วยเปิดโอกาสให้คนรุ่นใหม่ ผู้เชี่ยวชาญและผู้สนใจด้านดาต้า ได้มีโอกาสได้ใช้งาน Mobility data อย่างเต็มศักยภาพ ซึ่งเธอมีความคาดหวังว่าโครงการนี้จะขยายศักยภาพไปสู่ความการเปลี่ยนแปลงประเทศเชิงโครงสร้างเลยทีเดียว และนี่คือแนวทางการพัฒนาที่ยั่งยืนของดีแทค ในการสร้างคุณค่าร่วมกับสังคมโดยอาศัยศักยภาพของการเป็นผู้ให้บริการโทรคมนาคม เพื่อประโยชน์สาธารณะ

ติดตามข่าวสารจาก Brand Inside ได้จาก Facebook ของเรา