Skip to content

shootle48/Python-Scraper-SoundScape

 
 

Repository files navigation

Python Scraper สำหรับโปรเจกต์ SoundScape

โปรเจกต์นี้เป็นระบบดึงข้อมูล (Web Scraper) ที่พัฒนาด้วยภาษา Python เพื่อทำหน้าที่รวบรวมข้อมูลคอนเสิร์ตจากเว็บไซต์จำหน่ายบัตรชั้นนำในประเทศไทย และจัดการข้อมูลศิลปินเพื่อส่งต่อไปยัง API ของระบบ SoundScape

คุณสมบัติหลัก

  • ระบบดึงข้อมูลคอนเสิร์ตอัตโนมัติ: รองรับการดึงข้อมูลจากแพลตฟอร์มต่างๆ เช่น AllTicket, The Concert, Ticketier และ Highlight
  • ฐานข้อมูลศิลปินอัจฉริยะ: ดึงรายชื่อศิลปินยอดนิยมของประเทศไทยผ่าน Last.fm API และค้นหารูปภาพศิลปินความละเอียดสูงผ่าน Deezer API โดยอัตโนมัติ
  • ระบบตรวจจับและจับคู่ศิลปิน: สามารถวิเคราะห์ชื่อและรายละเอียดของคอนเสิร์ต เพื่อจับคู่กับฐานข้อมูลศิลปินที่มีอยู่ได้อย่างแม่นยำ
  • เชื่อมต่อ API อัตโนมัติ: ส่งข้อมูลคอนเสิร์ตและข้อมูลศิลปินที่ดึงมาได้ไปยัง Backend (Laravel) ของระบบ SoundScape ทันที

สิ่งที่ต้องเตรียมก่อนการติดตั้ง

  • Python 3.8 หรือสูงกว่า
  • เว็บเบราว์เซอร์ Microsoft Edge (ระบบใช้ Selenium ร่วมกับ msedgedriver)
  • API Key จาก Last.fm (สามารถสมัครใช้งานได้ฟรี)

การติดตั้ง

  1. เปิด Terminal หรือ Command Prompt แล้วเข้าไปที่โฟลเดอร์ของโปรเจกต์
  2. ติดตั้งไลบรารีที่จำเป็นทั้งหมดผ่านไฟล์ requirements.txt ด้วยคำสั่ง:
    pip install -r requirements.txt
  3. สร้างไฟล์ .env และใส่ Last.fm API Key ของคุณ

วิธีการใช้งาน

เพื่อให้ระบบทำงานได้อย่างสมบูรณ์และฐานข้อมูลมีประสิทธิภาพสูงสุด กรุณารันคำสั่งตามลำดับต่อไปนี้:

  1. สร้างไฟล์ฐานข้อมูลศิลปินแบบ Local (ทำเพียงครั้งแรก หรือเมื่อต้องการอัปเดตรายชื่อศิลปินใหม่):
    python artist/build_artists.py
  2. ซิงค์ข้อมูลศิลปินและรูปภาพไปยังฐานข้อมูลหลัก (ตรวจสอบให้แน่ใจว่าเปิดเซิร์ฟเวอร์ของฝั่ง Web Application ไว้แล้ว):
    python artist/seed_artists.py
  3. เริ่มการดึงข้อมูลคอนเสิร์ตจากทุกแพลตฟอร์ม:
    python run_all.py

หมายเหตุ

โปรเจกต์นี้ถูกสร้างขึ้นเพื่อจุดประสงค์ทางการศึกษา

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Python 100.0%