Package for parsing data (vacancies and resumes) from site hh.ru
Project description
Parse HH Data Project
Данный модуль предназначен для удобного скачивания вакансий и резюме с сайта hh.ru
from parse_hh_data import download, parse
vacancy = download.vacancy("36070814")
resume = download.resume("d40ce6f80001a8c8380039ed1f5874726f5a6e")
resume = parse.resume(resume)
Вакансии скачиваются с помощью API HH и возвращаются в формате описанном здесь.
Обезличенные резюме скачиваются непосредственно с сайта в html-формате, а затем могут быть преобразованны в json-формат:
name : str - название резюме
description : str - дополнительная информация, описание навыков в свободной форме (может содержать html-код)
key_skills : list - список ключевых навыков
name : str - название ключевого навыка
experiences : list - опыт работы
start : str - начало работы (дата в формате dd-MM-yyyy)
end : str - окончание работы (дата в формате dd-MM-yyyy)
position : str - должность
description : str - обязанности, функции, достижения (может содержать html-код)
с помощью parse_hh_data.parse.resume
.
Скачать списки идентификаторов вакансий или резюме можно используя
parse_hh_data.download.vacancy_ids
или parse_hh_data.download.resume_ids
, соответсвенно.
Command line interface
download_data resumes ~/data/resumes 13-04-2020 specializations.json
parse_resumes ~/data/resumes ~/data/resumes_json 13-04-2020 specializations.json
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for parse_hh_data-0.1.7-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | d71929ba2825ad942817cdcf50e0ffeceed2ad77e8b24210d225b885fd07f444 |
|
MD5 | 5523d2eb2660e511c22694fef4a9e758 |
|
BLAKE2b-256 | ebc773d64d813f42538bbdee42b4edd82667f211ac837849b11b08239d5a7638 |