Попытка выбора элемента на основе ссылки с объектом списка классов - beautifulsoup

Я использую Beautifulsoup 4.4 и python 3.6.6. Я извлек все ссылки, однако не могу распечатать все ссылки, которые содержат

'class': ['_self']

Это полная ссылка, которая извлекается, которую я хочу извлечь из списка ссылок.

{'href': 'https://www.racingnsw.com.au/news/latest-racing-news/highway-sixtysix-on-right-route/', 'class': ['_self'], 'target': '_self'}

Я не могу правильно получить синтаксис, хотя он выглядит как документы bs4 по атрибутам .

import requests as req
import json
from bs4 import BeautifulSoup

url = req.get(
    'https://www.racingnsw.com.au/media-news-premierships/latest-news/')

data = url.content

soup = BeautifulSoup(data, "html.parser")

links = soup.find_all('a')

for item in links:
    print(item['class']='self')

python,beautifulsoup,

0

Ответов: 1


3 принят

BeautifulSoup поддерживает селектор CSS, который позволяет вам выбирать элементы на основе содержимого определенных атрибутов. Сюда входит селектор * = для содержит.

import requests as req
from bs4 import BeautifulSoup

url = req.get(
    'https://www.racingnsw.com.au/media-news-premierships/latest-news/')

data = url.content

soup = BeautifulSoup(data, "html.parser")

for items in soup.select('a[class*="_self"]'):
    print(items)
питон, BeautifulSoup,
Похожие вопросы