Skip to main content

Package for parsing data (vacancies and resumes) from site hh.ru

Project description

Parse HH Data Project

Данный модуль предназначен для удобного скачивания вакансий и резюме с сайта hh.ru

from parse_hh_data import download, parse

vacancy = download.vacancy("36070814")

resume = download.resume("d40ce6f80001a8c8380039ed1f5874726f5a6e")
resume = parse.resume(resume)

Вакансии скачиваются с помощью API HH и возвращаются в формате описанном здесь.

Обезличенные резюме скачиваются непосредственно с сайта в html-формате, а затем могут быть преобразованны в json-формат:

birth_date : str - день рождения
gender : str - пол
area : str - город проживания
title : str - желаемая должность
specialization : list - специализации соискателя
    name : str - название специализации
    profarea_name : str - название профессиональной области, в которую входит специализация
salary : dict - желаемая зарплата
    amount : int - сумма
    currency : str - валюта
education_level : str - уровень образования
education : list - образование
    year : int - год окончания
    name : str - название учебного заведения
    organization : str - организация, специальность / специализация
language : list - список языков, которыми владеет соискатель
    name : str - название языка
    level : str - уровень знания языка
experience : list - опыт работы
    start : str - начало работы (дата в формате dd-MM-yyyy)
    end : str - окончание работы (дата в формате dd-MM-yyyy)
    position : str - должность
    description : str - обязанности, функции, достижения (может содержать html-код)
skills : str - дополнительная информация, описание навыков в свободной форме (может содержать html-код)
skill_set : list - ключевые навыки

с помощью parse_hh_data.parse.resume.

Скачать списки идентификаторов вакансий или резюме можно используя parse_hh_data.download.vacancy_ids или parse_hh_data.download.resume_ids, соответсвенно.

Command line interface

download ~/resumes resume --area_ids 113 --specialization_ids 1 --search_period 30

parse ~/data/resumes ~/data/resumes_json

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

parse-hh-data-0.1.14.tar.gz (7.3 kB view details)

Uploaded Source

File details

Details for the file parse-hh-data-0.1.14.tar.gz.

File metadata

  • Download URL: parse-hh-data-0.1.14.tar.gz
  • Upload date:
  • Size: 7.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.1.1 pkginfo/1.4.2 requests/2.22.0 setuptools/45.2.0 requests-toolbelt/0.8.0 tqdm/4.30.0 CPython/3.8.5

File hashes

Hashes for parse-hh-data-0.1.14.tar.gz
Algorithm Hash digest
SHA256 482b90e414c8ff755a19ae8360c97c1b721e183a0e4ec4e7adb778f4e4be737a
MD5 dc1ce4adc11ed06fe9881e2cd9efbb3f
BLAKE2b-256 0d8518a72db6fbab61ebd2aafd1e2a6d904e5fd99283e7726a788e083e81c7ab

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page