HomePhabricator
วิธีใช้ Database Matcher Tool (Excel)

URL: https://job.yellowpages.co.th/manage/typdb/tool/db-matcher


[1] วิธีเตรียมไฟล์

เตรียม Header (บรรทัดแรก) (ตัวอย่างบรรทัดสีเหลือง)

Column ที่จะนำไปเทียบ ต้องมีชื่อดังต่อไปนี้

custnamet+districtnamet+subdistrictnamet+postcode+citynamet+addresst+searchtel+
-----มีได้มากกว่า 1 column โดยแต่ละ column จะนำมาต่อกันก่อนนำไปประมวลผลแบ่งฟิลด์ที่อยู่มีได้มากกว่า 1 column โดยแต่ละ column มี 1 หมายเลขโทรศัพท์

หากไฟล์มีหลายชีท ทุกชีทจะถูกนำไปค้นหาหมด

[2] อัพโหลดไฟล์

กดเลือกไฟล์ แล้วกดปุ่ม Match ด้านล่าง
การทำงานอาจใช้เวลา ตั้งแต่ 10 วินาที ถึง หลายนาที ขึ้นอยู่กับขนาดข้อมูลที่จะนำไปเทียบ


ไฟล์ผลลัพท์

ไฟล์ที่ได้จะมีชีทเพิ่มขึ้นตามไฟล์ต้นฉบับที่นำไปเทียบ เช่น หากมี 2 ชีท ไฟล์ที่ได้จะมี 4 ชีท

ชีทที่มีชื่อต่อท้ายด้วย -ORIGINAL หมายถึงชีทต้นฉบับที่นำไปเทียบ โดยในชีทนี้หากมีการใช้ addresst+ จะมีการพยายามนำข้อมูลในคอลัมภ์ดังกล่าวไปแตกออกมา ซึ่งอาจจะต้องใช้มนุษย์ตรวจสอบความถูกต้องอีกครั้ง คอลัมภ์ที่แตกออกมานี้คือสิ่งที่ถูกนำไปใช้เทียบกับฐานข้อมูล

ชีทที่มีชื่อต่อท้ายด้วย -MATCHED หมายถึงชีทที่เก็บข้อมูลที่เทียบเจอ โดยมีคอลัมภ์พิเศษนอกจากคอลัมภ์อื่นๆที่เทียบเจอดังนี้

MATCH-MODE (เหลือง)MATCH-COUNT (เขียว)M-score
โหมดของการเทียบจำนวนทั้งหมดที่เทียบพบคะแนนของการเทียบ

คอลัมภ์ M-อื่นๆ คือข้อมูลในฐานข้อมูลต้นฉบับที่เทียบเจอ


โหมดของการเทียบ

exact-searchtelเจอโดยใช้หมายเลขโทรศัพท์ตรงๆ (searchtel+)น่าเชื่อถือสูง
guess-custname-city-districtเจอโดยใช้ส่วนของชื่อ แล้วไปหาในจังหวัด (citynamet+) และอำเภอ (districtnamet+)
guess-custname-city-postcodeเจอโดยใช้ส่วนของชื่อ แล้วไปหาในจังหวัด (citynamet+) และรหัสไปรษณีย์ (postcode+)น่าเชื่อถือสูง
guess-addressเจอโดยใช้ส่วนของชื่อ แล้วไปหาในข้อมูลที่อยู่อื่นๆที่ได้มาจาก addresst+

หลังจากนี้มนุษย์ต้องใช้วิจารณญาณตรวจสอบยืนยันข้อมูลที่เทียบได้ โดยเฉพาะข้อมูลชุดที่มี MATCH-COUNT มากกว่า 1 ข้อมูลจะต้องเลือกเอาเพียงข้อมูลเดียว โดยลบแถวอื่นๆที่ไม่เอาทิ้ง
และถึงหาก MATCH-COUNT จะเป็น 1 แต่ข้อมูลที่เทียบได้ไม่ถูกต้อง ก็ต้องลบออกไป

เมื่อกระบวนการดังกล่าวเสร็จสิ้น จึงนำคอลัมภ์ ROW-NUM ไปใช้ในการทำ VLOOKUP เพื่อนำคอลัมภ์ M-customerid ไปใส่ที่ชีท ORIGINAL เพื่อนำไฟล์ไปใช้ต่อไป

Written by vorapoap on Dec 6 2018, 5:24 AM.
User
Projects
None
Subscribers
hataimart

Event Timeline

Update Template 07 Jan 2020