-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathconfig.py
26 lines (20 loc) · 1.04 KB
/
config.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
# Пути до блоков с информацией
COMPANY_OVERVIEW_XPATH = '/html/body/div[1]/div[9]/div[2]/div[1]/div/div/div'
INFORMATION_XPATH = '/html/body/div[1]/div[9]/div[2]/div[2]/div/div'
# Путь до контейнера с полями 'key: value' относительно блока с информацией
FIELDS_XPATH = './div[contains(@class, "row")]'
# Пути до 'key: value' относительно самого контейнера
KEY_XPATH = './div[1]//p//text()'
VALUE_XPATH = './div[2]//p//text()'
# Пути до названия контейнера с данными о компании относительно самого контейнера
TITLES = ['./h5//text()', './h4//text()']
# Значения которые надо менять на null
CONVERT_TO_NULL = ['', 'Not Applic', 'Not Available']
# Сколько максимум компаний нужно спарсить
TOTAL = 1000
# MongoDB settings
USER = 'user'
PASSWORD = 'password'
HOST = 'localhost'
DB_NAME = 'difc'
COLLECTION_NAME = 'companies'