Preprocessor for kakaotalk message exported txt file
Project description
kakaotalk_msg_preprocessor
카카오톡 채팅방에서 대화 내보내기
를 통해 생성한 파일에 있는 메시지를 전처리해주는 라이브러리입니다.
주요 기능은 다음과 같습니다.
parser
: 카카오톡에서 export한 txt파일을 여러 메시지 정보(dict)를 담고있는 list로 파싱합니다.- 각 메시지 정보는 메시지를 보낸 시간(datetime), 메시지를 보낸 사람(user_name), 메시지 본문(text)를 key로 가지는 dictionary입니다.
[{'datetime': datetime.datetime(2020, 6, 28, 1, 1), 'user_name': '김한길', 'text': '사진'}, {'datetime': datetime.datetime(2020, 8, 11, 12, 3), 'user_name': '김한길', 'text': 'https://www.youtube.com'}]
url_msg_extractor
: 파싱한 데이터에서 URL이 포함되어 있는 메시지만 추출하여, URL과 메시지 정보를 담고 있는 list로 반환해줍니다.[{'datetime': datetime.datetime(2020, 8, 11, 12, 3), 'user_name': '김한길', 'url': 'https://www.youtube.com'}]
Guide
Install
pip install kakaotalk_msg_tokenizer
Usage
import kakaotalk_msg_tokenizer
카카오톡 메시지 파싱하기
# get the device type and language of kakaotalk_export_file
file_type = kakaotalk_msg_preprocessor.check_export_file_type(file_path)
print(file_type)
# Parsing the text from a kaotalk_export_file
messages = kakaotalk_msg_preprocessor.parser(file_type, file_path)
print(messages)
예시 결과
window_ko
[{'datetime': datetime.datetime(2020, 6, 28, 1, 1), 'user_name': '김한길', 'text': '사진'}, {'datetime': datetime.datetime(2020, 6, 28, 1, 3), 'user_name': '김한길', 'text': '공부하기'},
{'datetime': datetime.datetime(2020, 8, 11, 2, 41), 'user_name': '김한길', 'text': '화 19:30-22:30\n\n\n자유석권(선착순)\n오후 6시 녹화장 앞 번호표대로 줄서기, 6시 50분부터 입장\n- 번호표 배부 : 녹화일 9:00 ~ 18:20까지 (입장순서가 부여된 방청권 선착순 배부)\n- 입장시간: 18시까지 녹화장 앞에서 번호표대로 줄서기(번호표 지참), 18:50부터 입장\n- 번호표 배부는 오후 6시 20분에 마감. 마감 이후에 오신 분들은 별도로 통제합니다'},
{'datetime': datetime.datetime(2020, 8, 11, 12, 3), 'user_name': '김한길', 'text': 'https://www.youtube.com'}]
카카오톡 메시지에서 URL만 추출하기
url_messages = kakaotalk_msg_preprocessor.url_msg_extractor(file_type, messages)
print(url_messages)
예시 결과
[{'datetime': datetime.datetime(2020, 8, 11, 12, 3), 'user_name': '김한길', 'url': 'https://www.youtube.com'}]
지원 export 파일 종류
카카오톡은 카카오톡 앱 실행 환경에 따라 상이한 형식의 txt파일을 export합니다.
현재 정상작동이 확인된 환경은 다음과 같습니다.
- 윈도우(OS언어: 한글)
- 안드로이드(OS언어: 한글)
- 안드로이드(OS언어: 영어)
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Close
Hashes for kakaotalk_msg_preprocessor-0.12.tar.gz
Algorithm | Hash digest | |
---|---|---|
SHA256 | 2c7f291dca51efe403efbba0b025f40dcb2d6926f569878def38c4c07820664b |
|
MD5 | 6ac2f09b7bd3356e071b32e492404383 |
|
BLAKE2b-256 | e9ac8c04a9b5107730bfcde9c9d71a947759dc8cc117ffada015c02d1609f996 |
Close
Hashes for kakaotalk_msg_preprocessor-0.12-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | da8e4a793f6c3a006b2adb7a80e9a2a8428a683e5ecd73aceb613b7838652d99 |
|
MD5 | 38dea346eee54d21e95ad6a09ad88cfe |
|
BLAKE2b-256 | ab2cab0751540dc93f99ab063d715665162226c796f48c7fb45d526808c05605 |