ดาวไม่ได้ใช้งานดาวไม่ได้ใช้งานดาวไม่ได้ใช้งานดาวไม่ได้ใช้งานดาวไม่ได้ใช้งาน
 

               หลังจากที่เราได้ศึกษาการใช้งานภาษา Python ไพทอน  จากบทความต่างๆ เช่น ตัวแปรชนิดดิกชันนารี ใน ไพทอน Python Dictionary Data type  , ตัวแปร และ คำสงวน ในภาษา Python ไพทอน และ แปลข้อความจากภาษาอังกฤษเป็นเป็นภาษาไทยโดยกูเกิ้ลแปลภาษา ด้วยโมดูลซิลิเนียม   

 

ฟังชั่นบิ๊วอินของตัวแปรเซต   ในภาษาไพธอน

               เซตในทางคณิตศาสตร์  เราอาจจะมองได้ว่าเป็นการรวบรวมกลุ่มของวัตถุต่างๆ ไว้รวมกันทั้งชุด   ความคิดนี้จะดูง่ายๆ แต่เซตเป็นแนวคิดที่เป็นรากฐานสำคัญที่สุดอย่างหนึ่งของคณิตศาสตร์สมัยใหม่ การศึกษาโครงสร้างเซตที่เป็นไปได้ ทฤษฏีเซตมีความสำคัญและได้รับความสนใจอย่างมากและกำลังดำเนินไปอย่างต่อเนื่อง  ในภาษาไพธอนนั้นก็มีฟังก์ชั่น built-in (บิ๊วอิน)  สำหรับเซตด้วยเพื่ออำนวยคำวามสะดวกแก่การเขียนโปรแกรมในภาษาไพธอน ในบทความนี้จะมาแนะนำการอินเตอร์เซคชั่น  ซึ่งก็คือ การนำเซตมาเปรียบเทียบกันแล้วพิจารณาตัวที่เหมือนกัน

 

การใช้ intersection (อินเตอร์เซคชั่น) ประยุกต์ใช้กับ โมดูล selenium (ซิลิเนียม)

                เขียนโค้ดดังนี้

from selenium import webdriver
from pythainlp import word_tokenize
import time,random,re


driver = webdriver.Firefox(executable_path=r'C:\Users\BDC-CLUB\PycharmProjects\mdsoft\geckodriver.exe')

driver.get("http://www.mindphp.com/online-tools/tags.html")
search = driver.find_element_by_id("filter-search")
search.send_keys("data") #ใส่คำไปในเว็บ
search.submit() #ใส่คำเสร็จไปเเสริช
time.sleep(3)
ids = driver.find_elements_by_xpath("//*[@id='adminForm']/ul/li/div/a")#เก็บ idsของtags
ids_list = [] #เก็บกลุ่มข้อความลงตัวแปร
for i in ids:
    ids_list.append(i.text)
print(ids_list)

driver.get("http://www.mindphp.com/online-tools/tags.html")
search = driver.find_element_by_id("filter-search")
search.send_keys("type") #ใส่คำไปในเว็บ
search.submit() #ใส่คำเสร็จไปเเสริช
time.sleep(3)
ids2 = driver.find_elements_by_xpath("//*[@id='adminForm']/ul/li/div/a")#เก็บ idsของtags
ids_list2 = []  #เก็บกลุ่มข้อความลงตัวแปร
for i in ids2:
    ids_list2.append(i.text)
print(ids_list2)

ids_list = set(ids_list)    #แปลงตัวแปรลิสต์เป็นเซต
ids_list2 = set(ids_list2)

a = ids_list.intersection(ids_list2)  #นำข้อมูล 2 ตัวมาเปรียบเทียบกัน แล้วเลือกตัวที่เหมือนกันออกมา
print(a)

 

                  ผลการรัน:บรรทัด1 คือข้อมูลชุดแรก  บรรทัด2 คือข้อมูลชุด2  และบรรทัด3 คือการอินเตอร์เซตชั่นกันระหว่างข้อมูลทั้ง 2 ชุด

['Big data', 'data center', 'Data Communications', 'data model', 'Data Processing', 'Data structure', 'Data-Transfer', 'Database', 'Database Server', 'DataType']
['DataType', 'Mime Type', 'prototype', 'USB Type C']
{'DataType'}

               

 

                ข้อมูลชุดแรกจากหน้าเว็บ

 

 

               ข้อมูลชุดที่2 จากหน้าเว็บ

 

อ้างอิง: วิกิพีเดีย