agent-browser จาก Vercel: เบราว์เซอร์สุดลื่นสำหรับ AI Agent ประหยัดโทเค็น 90% แนะนำแทน Chrome!

https://x.com/nanobro_rit/status/2029465947480965536

Ai agent มักจะ fail ตอนคุม browser หรือทำงานได้ช้ามาก เรียกได้ว่าปวดตับสุดๆเลยแหละ

ส่วนอันนี้ agent-browser ออกแบบมาสำหรับ agent โดยเฉพาะเลย ถือว่าดีมาก ลื่นขึ้นมาก แนะนำให้ทุกคนสอนน้องกุ้งให้ใช้ browser นี้แทน chrome ครับ

เซฟไว้เลยๆๆ

https://github.com/vercel-labs/agent-browser

Agent-browser จาก Vercel Labs คือเครื่องมือที่ช่วยให้ "AI สามารถใช้งานเบราว์เซอร์แทนเราได้" โดยเน้นความง่าย รวดเร็ว และประหยัดค่าใช้จ่ายสำหรับนักพัฒนาที่สร้าง AI Agent ครับ

สรุปแบบเข้าใจง่ายๆ ดังนี้ครับ:

มันคืออะไร? ปกติเวลาเราเขียนโปรแกรมควบคุมเบราว์เซอร์ (เช่น กดปุ่ม, พิมพ์ข้อความ) เราจะใช้เครื่องมืออย่าง Playwright หรือ Selenium แต่เครื่องมือพวกนั้นถูกสร้างมาให้ "คน" เขียนโค้ดสั่ง แต่ agent-browser ถูกสร้างมาให้ "AI" เป็นคนสั่งงานผ่านคำสั่งสั้นๆ (CLI)
ทำไมถึงต้องมีตัวนี้? (จุดเด่น) ประหยัด "สมอง" AI (Token Efficiency): เวลา AI จะคลิกปุ่มในเว็บ มันต้องอ่านโครงสร้างหน้าเว็บ (HTML) ทั้งหมด ซึ่งปกติจะยาวมากและเปลืองเงิน (Token) แต่ตัวนี้จะสรุปหน้าเว็บให้เหลือแค่จุดที่คลิกได้และตั้งชื่อย่อให้ เช่น @e1, @e2 ทำให้ AI เข้าใจหน้าเว็บได้เร็วขึ้นและประหยัดค่า API ไปได้กว่า 90%

ทำงานเร็วมาก: ตัวโปรแกรมหลักเขียนด้วยภาษา Rust ทำให้เปิดใช้งานได้ในเสี้ยววินาที (น้อยกว่า 0.05 วินาที)

จำหน้าเว็บได้ต่อเนื่อง: มันมีระบบ "Daemon" ที่ช่วยให้เบราว์เซอร์เปิดค้างไว้ได้ ทำให้ AI สามารถสั่งงานต่อเนื่องหลายขั้นตอนได้ทันที (เช่น เปิดเว็บ > ล็อกอิน > ค้นหาข้อมูล) โดยไม่ต้องเริ่มใหม่ทุกรอบ

ตัวอย่างการใช้งาน (Workflow) ถ้าเราสั่ง AI ให้ไปซื้อของในเว็บ ขั้นตอนที่เครื่องมือนี้ทำคือ:

Open: สั่งเปิดเว็บเป้าหมาย

Snapshot: สรุปหน้าเว็บออกมาเป็นรายการสั้นๆ ว่ามีปุ่มตรงไหนบ้าง

Interact: AI จะดูรายการแล้วสั่ง เช่น "คลิกที่ @e5 (ปุ่มตระกร้าสินค้า)"

More from nanobro

Cover image for วิธียิง ads twitter - boost tweet

nanobro

Jul 28

วิธียิง ads twitter - boost tweet

ไว้เป็นแนวทางให้มือใหม่

Cover image for มาฝึก deploy Contract และ เก็บ 13 Base Camp testnet NFT

nanobro

Jul 8

มาฝึก deploy Contract และ เก็บ 13 Base Camp testnet NFT

Base บอกว่าสิ้นปี จะเอา NFT ขึ้น mainnet ด้วย

Subscribe to nanobro

>500 subscribers

https://x.com/nanobro_rit/status/2029465947480965536

Ai agent มักจะ fail ตอนคุม browser หรือทำงานได้ช้ามาก เรียกได้ว่าปวดตับสุดๆเลยแหละ

เซฟไว้เลยๆๆ

https://github.com/vercel-labs/agent-browser

สรุปแบบเข้าใจง่ายๆ ดังนี้ครับ:

มันคืออะไร? ปกติเวลาเราเขียนโปรแกรมควบคุมเบราว์เซอร์ (เช่น กดปุ่ม, พิมพ์ข้อความ) เราจะใช้เครื่องมืออย่าง Playwright หรือ Selenium แต่เครื่องมือพวกนั้นถูกสร้างมาให้ "คน" เขียนโค้ดสั่ง แต่ agent-browser ถูกสร้างมาให้ "AI" เป็นคนสั่งงานผ่านคำสั่งสั้นๆ (CLI)
ทำไมถึงต้องมีตัวนี้? (จุดเด่น) ประหยัด "สมอง" AI (Token Efficiency): เวลา AI จะคลิกปุ่มในเว็บ มันต้องอ่านโครงสร้างหน้าเว็บ (HTML) ทั้งหมด ซึ่งปกติจะยาวมากและเปลืองเงิน (Token) แต่ตัวนี้จะสรุปหน้าเว็บให้เหลือแค่จุดที่คลิกได้และตั้งชื่อย่อให้ เช่น @e1, @e2 ทำให้ AI เข้าใจหน้าเว็บได้เร็วขึ้นและประหยัดค่า API ไปได้กว่า 90%

ตัวอย่างการใช้งาน (Workflow) ถ้าเราสั่ง AI ให้ไปซื้อของในเว็บ ขั้นตอนที่เครื่องมือนี้ทำคือ:

Open: สั่งเปิดเว็บเป้าหมาย

Snapshot: สรุปหน้าเว็บออกมาเป็นรายการสั้นๆ ว่ามีปุ่มตรงไหนบ้าง

Interact: AI จะดูรายการแล้วสั่ง เช่น "คลิกที่ @e5 (ปุ่มตระกร้าสินค้า)"

agent-browser จาก Vercel: เบราว์เซอร์สุดลื่นสำหรับ AI Agent ประหยัดโทเค็น 90% แนะนำแทน Chrome!

https://x.com/nanobro_rit/status/2029465947480965536

Ai agent มักจะ fail ตอนคุม browser หรือทำงานได้ช้ามาก เรียกได้ว่าปวดตับสุดๆเลยแหละ

เซฟไว้เลยๆๆ

https://github.com/vercel-labs/agent-browser

สรุปแบบเข้าใจง่ายๆ ดังนี้ครับ:

มันคืออะไร? ปกติเวลาเราเขียนโปรแกรมควบคุมเบราว์เซอร์ (เช่น กดปุ่ม, พิมพ์ข้อความ) เราจะใช้เครื่องมืออย่าง Playwright หรือ Selenium แต่เครื่องมือพวกนั้นถูกสร้างมาให้ "คน" เขียนโค้ดสั่ง แต่ agent-browser ถูกสร้างมาให้ "AI" เป็นคนสั่งงานผ่านคำสั่งสั้นๆ (CLI)
ทำไมถึงต้องมีตัวนี้? (จุดเด่น) ประหยัด "สมอง" AI (Token Efficiency): เวลา AI จะคลิกปุ่มในเว็บ มันต้องอ่านโครงสร้างหน้าเว็บ (HTML) ทั้งหมด ซึ่งปกติจะยาวมากและเปลืองเงิน (Token) แต่ตัวนี้จะสรุปหน้าเว็บให้เหลือแค่จุดที่คลิกได้และตั้งชื่อย่อให้ เช่น @e1, @e2 ทำให้ AI เข้าใจหน้าเว็บได้เร็วขึ้นและประหยัดค่า API ไปได้กว่า 90%

ตัวอย่างการใช้งาน (Workflow) ถ้าเราสั่ง AI ให้ไปซื้อของในเว็บ ขั้นตอนที่เครื่องมือนี้ทำคือ:

Open: สั่งเปิดเว็บเป้าหมาย

Snapshot: สรุปหน้าเว็บออกมาเป็นรายการสั้นๆ ว่ามีปุ่มตรงไหนบ้าง

Interact: AI จะดูรายการแล้วสั่ง เช่น "คลิกที่ @e5 (ปุ่มตระกร้าสินค้า)"

More from nanobro

nanobro

Jul 28

วิธียิง ads twitter - boost tweet

ไว้เป็นแนวทางให้มือใหม่

nanobro

Jul 8

มาฝึก deploy Contract และ เก็บ 13 Base Camp testnet NFT

Base บอกว่าสิ้นปี จะเอา NFT ขึ้น mainnet ด้วย

nanobro

agent-browser จาก Vercel: เบราว์เซอร์สุดลื่นสำหรับ AI Agent ประหยัดโทเค็น 90% แนะนำแทน Chrome!

More from nanobro

nanobro

More from nanobro

No activity yet

agent-browser จาก Vercel: เบราว์เซอร์สุดลื่นสำหรับ AI Agent ประหยัดโทเค็น 90% แนะนำแทน Chrome!

More from nanobro

nanobro

nanobro

agent-browser จาก Vercel: เบราว์เซอร์สุดลื่นสำหรับ AI Agent ประหยัดโทเค็น 90% แนะนำแทน Chrome!

No activity yet

More from nanobro

No activity yet

No activity yet