Skip to main content

A dialogue bot with a personality

Project description

Dataset

hypothesis 1

использовал CausalLM и Seq2Seq. Seq2Seq показал себя лучше.
Seq2Seq:
входная последовательность: сконкатенированная персона + chat: + последняя реплика от пользователя
таргет: ответ от пользователя
CausalLM:
входная последовательность: сконкатенированная персона + последняя реплика от пользователя+ответ от пользователя
таргет: входная последовательность сдвинутая на 1 вправо

hypothesis 2

Seq2Seq:
входная последовательность:
<bos> <persona> persona_fact[0]<p_sep>persona_fact[1]<p_sep>persona_fact[2]<p_sep>persona_fact[3]<p_sep>persona_fact[4]<p_sep> <chat> реплика[-6]<с_sep>реплика[-5]<с_sep>реплика[-4]<с_sep>реплика[-3]<с_sep>реплика[-2]<response>
таргет: реплика[-1] <eos>

CausalLM:
входная последовательность:
<bos> <persona> persona_fact[0]<p_sep>persona_fact[1]<p_sep>persona_fact[2]<p_sep>persona_fact[3]<p_sep>persona_fact[4]<p_sep> <chat> реплика[-6]<с_sep>реплика[-5]<с_sep>реплика[-4]<с_sep>реплика[-3]<с_sep>реплика[-2]<response>реплика[-1]<eos_token>
таргет: входная последовательность сдвинутая на 1 вправо

<с_sep> - специальный токен, который разделяет реплики.
<p_sep> - специальный токен, который разделяет персону.
<chat> - специальный токен, который разделяет реплики от персоны.
<persona> - специальный токен, который разделяет персону от реплик.
<response> - специальный токен, который разделяет реплики от ответа.

hypothesis 3

попробовать случайно перемешать порядок предложений в персоне. в остальном все остальное также как и в hypothesis 2

hypothesis 4

Seq2Seq:
входная последовательность:
<bos> <persona> persona_fact[0]persona_fact[1]persona_fact[2]persona_fact[3]persona_fact[4]<sep>реплика[-6] реплика[-5] ... <query>реплика[-2]<query/><eos>
таргет:<bos><response>реплика[-1]<response/><eos>

<sep> - специальный токен, раздедяющий токен
<query> - специальный токен, который оборачивает последнюю реплику пользователя
<query/> - 
<response> - специальный токен, оборачивает ответ пользователя
<response/> 

hypothesis 5

тоже самое что и в hypothesis 4, но теперь исполььзую датасет FoCus	
python3 -m build
twine upload dist/*

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

dimweb_persona_bot-0.0.6.tar.gz (52.7 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

dimweb_persona_bot-0.0.6-py3-none-any.whl (68.8 kB view details)

Uploaded Python 3

File details

Details for the file dimweb_persona_bot-0.0.6.tar.gz.

File metadata

  • Download URL: dimweb_persona_bot-0.0.6.tar.gz
  • Upload date:
  • Size: 52.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.10.6

File hashes

Hashes for dimweb_persona_bot-0.0.6.tar.gz
Algorithm Hash digest
SHA256 f4d886e0b28400b788013479c58a0b373a40445b1d4c01655356a9bb04b0a637
MD5 6ed63e655bb078833a973a364c4d1dc8
BLAKE2b-256 afc609d97299180238c62ce748fe42ebc23163f1c97424938fcebea7a6bdcf80

See more details on using hashes here.

File details

Details for the file dimweb_persona_bot-0.0.6-py3-none-any.whl.

File metadata

File hashes

Hashes for dimweb_persona_bot-0.0.6-py3-none-any.whl
Algorithm Hash digest
SHA256 c591e88f35ed9285063450f959721dfa3868ea2e4f83e73537f3bc396d8637f9
MD5 b0f3464d98a6ed1ab8e4306a434631ea
BLAKE2b-256 3fadde4efbf281877f2863b1795feb845803ca1fc4f1d1d33761f00b32d37f9a

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page