>400 subscribers
https://x.com/nanobro_rit/status/2029465947480965536
Ai agent มักจะ fail ตอนคุม browser หรือทำงานได้ช้ามาก เรียกได้ว่าปวดตับสุดๆเลยแหละ
ส่วนอันนี้ agent-browser ออกแบบมาสำหรับ agent โดยเฉพาะเลย ถือว่าดีมาก ลื่นขึ้นมาก แนะนำให้ทุกคนสอนน้องกุ้งให้ใช้ browser นี้แทน chrome ครับ
เซฟไว้เลยๆๆ
https://github.com/vercel-labs/agent-browser
Agent-browser จาก Vercel Labs คือเครื่องมือที่ช่วยให้ "AI สามารถใช้งานเบราว์เซอร์แทนเราได้" โดยเน้นความง่าย รวดเร็ว และประหยัดค่าใช้จ่ายสำหรับนักพัฒนาที่สร้าง AI Agent ครับ
สรุปแบบเข้าใจง่ายๆ ดังนี้ครับ:
มันคืออะไร? ปกติเวลาเราเขียนโปรแกรมควบคุมเบราว์เซอร์ (เช่น กดปุ่ม, พิมพ์ข้อความ) เราจะใช้เครื่องมืออย่าง Playwright หรือ Selenium แต่เครื่องมือพวกนั้นถูกสร้างมาให้ "คน" เขียนโค้ดสั่ง แต่ agent-browser ถูกสร้างมาให้ "AI" เป็นคนสั่งงานผ่านคำสั่งสั้นๆ (CLI)
ทำไมถึงต้องมีตัวนี้? (จุดเด่น) ประหยัด "สมอง" AI (Token Efficiency): เวลา AI จะคลิกปุ่มในเว็บ มันต้องอ่านโครงสร้างหน้าเว็บ (HTML) ทั้งหมด ซึ่งปกติจะยาวมากและเปลืองเงิน (Token) แต่ตัวนี้จะสรุปหน้าเว็บให้เหลือแค่จุดที่คลิกได้และตั้งชื่อย่อให้ เช่น @e1, @e2 ทำให้ AI เข้าใจหน้าเว็บได้เร็วขึ้นและประหยัดค่า API ไปได้กว่า 90%
ทำงานเร็วมาก: ตัวโปรแกรมหลักเขียนด้วยภาษา Rust ทำให้เปิดใช้งานได้ในเสี้ยววินาที (น้อยกว่า 0.05 วินาที)
จำหน้าเว็บได้ต่อเนื่อง: มันมีระบบ "Daemon" ที่ช่วยให้เบราว์เซอร์เปิดค้างไว้ได้ ทำให้ AI สามารถสั่งงานต่อเนื่องหลายขั้นตอนได้ทันที (เช่น เปิดเว็บ > ล็อกอิน > ค้นหาข้อมูล) โดยไม่ต้องเริ่มใหม่ทุกรอบ
ตัวอย่างการใช้งาน (Workflow) ถ้าเราสั่ง AI ให้ไปซื้อของในเว็บ ขั้นตอนที่เครื่องมือนี้ทำคือ:
Open: สั่งเปิดเว็บเป้าหมาย
Snapshot: สรุปหน้าเว็บออกมาเป็นรายการสั้นๆ ว่ามีปุ่มตรงไหนบ้าง
Interact: AI จะดูรายการแล้วสั่ง เช่น "คลิกที่ @e5 (ปุ่มตระกร้าสินค้า)"
https://x.com/nanobro_rit/status/2029465947480965536
Ai agent มักจะ fail ตอนคุม browser หรือทำงานได้ช้ามาก เรียกได้ว่าปวดตับสุดๆเลยแหละ
ส่วนอันนี้ agent-browser ออกแบบมาสำหรับ agent โดยเฉพาะเลย ถือว่าดีมาก ลื่นขึ้นมาก แนะนำให้ทุกคนสอนน้องกุ้งให้ใช้ browser นี้แทน chrome ครับ
เซฟไว้เลยๆๆ
https://github.com/vercel-labs/agent-browser
Agent-browser จาก Vercel Labs คือเครื่องมือที่ช่วยให้ "AI สามารถใช้งานเบราว์เซอร์แทนเราได้" โดยเน้นความง่าย รวดเร็ว และประหยัดค่าใช้จ่ายสำหรับนักพัฒนาที่สร้าง AI Agent ครับ
สรุปแบบเข้าใจง่ายๆ ดังนี้ครับ:
มันคืออะไร? ปกติเวลาเราเขียนโปรแกรมควบคุมเบราว์เซอร์ (เช่น กดปุ่ม, พิมพ์ข้อความ) เราจะใช้เครื่องมืออย่าง Playwright หรือ Selenium แต่เครื่องมือพวกนั้นถูกสร้างมาให้ "คน" เขียนโค้ดสั่ง แต่ agent-browser ถูกสร้างมาให้ "AI" เป็นคนสั่งงานผ่านคำสั่งสั้นๆ (CLI)
ทำไมถึงต้องมีตัวนี้? (จุดเด่น) ประหยัด "สมอง" AI (Token Efficiency): เวลา AI จะคลิกปุ่มในเว็บ มันต้องอ่านโครงสร้างหน้าเว็บ (HTML) ทั้งหมด ซึ่งปกติจะยาวมากและเปลืองเงิน (Token) แต่ตัวนี้จะสรุปหน้าเว็บให้เหลือแค่จุดที่คลิกได้และตั้งชื่อย่อให้ เช่น @e1, @e2 ทำให้ AI เข้าใจหน้าเว็บได้เร็วขึ้นและประหยัดค่า API ไปได้กว่า 90%
ทำงานเร็วมาก: ตัวโปรแกรมหลักเขียนด้วยภาษา Rust ทำให้เปิดใช้งานได้ในเสี้ยววินาที (น้อยกว่า 0.05 วินาที)
จำหน้าเว็บได้ต่อเนื่อง: มันมีระบบ "Daemon" ที่ช่วยให้เบราว์เซอร์เปิดค้างไว้ได้ ทำให้ AI สามารถสั่งงานต่อเนื่องหลายขั้นตอนได้ทันที (เช่น เปิดเว็บ > ล็อกอิน > ค้นหาข้อมูล) โดยไม่ต้องเริ่มใหม่ทุกรอบ
ตัวอย่างการใช้งาน (Workflow) ถ้าเราสั่ง AI ให้ไปซื้อของในเว็บ ขั้นตอนที่เครื่องมือนี้ทำคือ:
Open: สั่งเปิดเว็บเป้าหมาย
Snapshot: สรุปหน้าเว็บออกมาเป็นรายการสั้นๆ ว่ามีปุ่มตรงไหนบ้าง
Interact: AI จะดูรายการแล้วสั่ง เช่น "คลิกที่ @e5 (ปุ่มตระกร้าสินค้า)"
เหมาะกับใคร? คนสร้าง AI Agent: เช่น สร้างบอทที่ช่วยจองตั๋วเครื่องบิน หรือบอทที่ช่วยทดสอบหน้าเว็บ (Automated Testing)
AI Coding Tools: ใช้ร่วมกับเครื่องมืออย่าง Claude Code หรือ Cursor เพื่อให้ AI สามารถรันเว็บขึ้นมาตรวจสอบดูว่าโค้ดที่มันเขียนทำงานถูกต้องจริงๆ หรือไม่
สรุปสั้นๆ: มันคือ "รีโมทคอนโทรลสำหรับเบราว์เซอร์" ที่ออกแบบมาให้ AI ถือใช้งานได้ถนัดมือที่สุดนั่นเองครับ
เหมาะกับใคร? คนสร้าง AI Agent: เช่น สร้างบอทที่ช่วยจองตั๋วเครื่องบิน หรือบอทที่ช่วยทดสอบหน้าเว็บ (Automated Testing)
AI Coding Tools: ใช้ร่วมกับเครื่องมืออย่าง Claude Code หรือ Cursor เพื่อให้ AI สามารถรันเว็บขึ้นมาตรวจสอบดูว่าโค้ดที่มันเขียนทำงานถูกต้องจริงๆ หรือไม่
สรุปสั้นๆ: มันคือ "รีโมทคอนโทรลสำหรับเบราว์เซอร์" ที่ออกแบบมาให้ AI ถือใช้งานได้ถนัดมือที่สุดนั่นเองครับ
Share Dialog
Share Dialog
No comments yet