Package for parsing data (vacancies and resumes) from site hh.ru
Project description
Parse HH Data Project
Данный модуль предназначен для удобного скачивания вакансий и резюме с сайта hh.ru
from parse_hh_data import download, parse
vacancy = download.vacancy("36070814")
resume = download.resume("d40ce6f80001a8c8380039ed1f5874726f5a6e")
resume = parse.resume(resume)
Вакансии скачиваются с помощью API HH и возвращаются в формате описанном здесь.
Обезличенные резюме скачиваются непосредственно с сайта в html-формате, а затем могут быть преобразованны в json-формат:
birth_date : str - день рождения
gender : str - пол
area : str - город проживания
title : str - желаемая должность
specialization : list - специализации соискателя
name : str - название специализации
profarea_name : str - название профессиональной области, в которую входит специализация
salary : dict - желаемая зарплата
amount : int - сумма
currency : str - валюта
education_level : str - уровень образования
education : list - образование
year : int - год окончания
name : str - название учебного заведения
organization : str - организация, специальность / специализация
language : list - список языков, которыми владеет соискатель
name : str - название языка
level : str - уровень знания языка
experience : list - опыт работы
start : str - начало работы (дата в формате dd-MM-yyyy)
end : str - окончание работы (дата в формате dd-MM-yyyy)
position : str - должность
description : str - обязанности, функции, достижения (может содержать html-код)
skills : str - дополнительная информация, описание навыков в свободной форме (может содержать html-код)
skill_set : list - ключевые навыки
с помощью parse_hh_data.parse.resume
.
Скачать списки идентификаторов вакансий или резюме можно используя
parse_hh_data.download.vacancy_ids
или parse_hh_data.download.resume_ids
, соответсвенно.
Command line interface
download ~/resumes resume --area_ids 113 --specialization_ids 1 --search_period 30
parse ~/data/resumes ~/data/resumes_json
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for parse_hh_data-0.1.12-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 8ecd19db9ea78cd81d8cfb3c7c453b23caf0d063308e9791611a7798ed2b2f7c |
|
MD5 | 2256a49b01689cc1107953168d65a76d |
|
BLAKE2b-256 | e852365955d618785aeb8b937d0fd6ddcbd7d41fa0a952fbbb7e713e1a4cb5e3 |