wikitextparser

A simple, purely python, WikiText parsing tool.

These details have not been verified by PyPI

Project links

Homepage

Development Status
- 3 - Alpha
Intended Audience
- Developers
- End Users/Desktop
License
- OSI Approved :: GNU General Public License v3 (GPLv3)
Natural Language
- English
Programming Language
- Python :: 3.4
Topic
- Text Processing
- Utilities

Project description

A simple, purely python, WikiText parsing tool.

The purpose is to allow users easily extract and/or manipulate templates, template parameters, parser functions, tables, external links, wikilinks, etc. in wikitexts.

Installation

Use pip install wikitextparser

Usage

Here is a short demo of some of the functionalities:

>>> import wikitextparser as wtp

WikiTextParser can detect sections, parserfunctions, templates, wikilinks, external links, arguments, tables, and HTML comments in your wikitext:

>>> wt = wtp.parse("""
== h2 ==
t2

=== h3 ===
t3

== h22 ==
t22

{{text|value1{{text|value2}}}}

[[A|B]]""")
>>>
>>> wt.templates
[Template('{{text|value2}}'), Template('{{text|value1{{text|value2}}}}')]
>>> wt.templates[1].arguments
[Argument("|value1{{text|value2}}")]
>>> wt.templates[1].arguments[0].value = 'value3'
>>> print(wt)

== h2 ==
t2

=== h3 ===
t3

== h22 ==
t22

{{text|value3}}

[[A|B]]

It provides easy-to-use properties so you can get or set names or values of templates, arguments, wikilinks, etc.:

>>> wt.wikilinks
[WikiLink("[[A|B]]")]
>>> wt.wikilinks[0].target = 'Z'
>>> wt.wikilinks[0].text = 'X'
>>> wt.wikilinks[0]
WikiLink('[[Z|X]]')
>>>
>>> from pprint import pprint
>>> pprint(wt.sections)
[Section('\n'),
 Section('== h2 ==\nt2\n\n=== h3 ===\nt3\n\n'),
 Section('=== h3 ===\nt3\n\n'),
 Section('== h22 ==\nt22\n\n{{text|value3}}\n\n[[Z|X]]')]
>>>
>>> wt.sections[1].title = 'newtitle'
>>> print(wt)

==newtitle==
t2

=== h3 ===
t3

== h22 ==
t22

{{text|value3}}

[[Z|X]]

There is a pprint function that pretty-prints templates:

>>> p = wtp.parse('{{t1 |b=b|c=c| d={{t2|e=e|f=f}} }}')
>>> t2, t1 = p.templates
>>> print(t2.pprint())
{{t2
    |e=e
    |f=f
}}
>>> print(t1.pprint())
{{t1
    |b=b
    |c=c
    |d={{t2
        |e=e
        |f=f
    }}
}}

If you are dealing with [[Category:Pages using duplicate arguments in template calls]] there are two functions that may be helpful:

>>> t = wtp.Template('{{t|a=a|a=b|a=a}}')
>>> t.rm_dup_args_safe()
>>> t
Template('{{t|a=b|a=a}}')
>>> t = wtp.Template('{{t|a=a|a=b|a=a}}')
>>> t.rm_first_of_dup_args()
>>> t
Template('{{t|a=a}}')

Extracting cell values of a table is easy:

>>> p = wtp.parse("""{|
|  Orange    ||   Apple   ||   more
|-
|   Bread    ||   Pie     ||   more
|-
|   Butter   || Ice cream ||  and more
|}""")
>>> pprint(p.tables[0].getdata)
[['Orange', 'Apple', 'more'],
 ['Bread', 'Pie', 'more'],
 ['Butter', 'Ice cream', 'and more']]

And values are rearranged according to colspan and rowspan attributes (by default):

>>> t = wtp.Table("""{| class="wikitable sortable"
|-
! a !! b !! c
|-
!colspan = "2" | d || e
|-
|}""")
>>> t.getdata(span=True)
[['a', 'b', 'c'], ['d', 'd', 'e']]

Have a look at the test modules for more details and probable pitfalls.

Project details

These details have not been verified by PyPI

Project links

Homepage

Development Status
- 3 - Alpha
Intended Audience
- Developers
- End Users/Desktop
License
- OSI Approved :: GNU General Public License v3 (GPLv3)
Natural Language
- English
Programming Language
- Python :: 3.4
Topic
- Text Processing
- Utilities

Release history Release notifications | RSS feed

0.56.4

May 14, 2025

0.56.3

Oct 18, 2024

0.56.2

Aug 3, 2024

0.56.1

Jul 19, 2024

0.56.0

Jun 28, 2024

0.55.14

Jun 28, 2024

0.55.13

Apr 19, 2024

0.55.12

Apr 12, 2024

0.55.11

Apr 9, 2024

0.55.10

Mar 19, 2024

0.55.9

Mar 11, 2024

0.55.8

Jan 15, 2024

0.55.7

Dec 21, 2023

0.55.6

Nov 25, 2023

0.55.5

Nov 8, 2023

0.55.4

Nov 7, 2023

0.55.3

Nov 7, 2023

0.55.2

Nov 5, 2023

0.55.1

Nov 5, 2023

0.55.0

Nov 5, 2023

0.54.1

Nov 3, 2023

0.54.1.dev0 pre-release

Nov 3, 2023

0.54.0

Aug 14, 2023

0.53.0

Jul 7, 2023

0.52.1

May 19, 2023

0.52.0

May 19, 2023

0.51.2

Apr 21, 2023

0.51.1

Oct 14, 2022

0.51.0

Sep 16, 2022

0.50.2

Sep 10, 2022

0.50.1

Aug 29, 2022

0.50.0

Aug 29, 2022

0.49.4

Jul 28, 2022

0.49.3

Jul 4, 2022

0.49.2

May 20, 2022

0.49.1

Apr 11, 2022

0.49.0

Apr 11, 2022

0.48.3

Apr 8, 2022

0.48.2

Mar 9, 2022

0.48.1

Mar 5, 2022

0.48.0

Dec 31, 2021

0.47.10.dev2 pre-release

Dec 31, 2021

0.47.10.dev1 pre-release

Dec 31, 2021

0.47.10.dev0 pre-release

Dec 31, 2021

0.47.9

Nov 26, 2021

0.47.8

Nov 19, 2021

0.47.7

Nov 11, 2021

0.47.6

Nov 5, 2021

0.47.5

Jun 3, 2021

0.47.4

Mar 21, 2021

0.47.3

Feb 14, 2021

0.47.2

Feb 13, 2021

0.47.1

Feb 5, 2021

0.47.0

Nov 28, 2020

0.46.0

Oct 14, 2020

0.45.3

Oct 11, 2020

0.45.2

Sep 30, 2020

0.45.1

Sep 25, 2020

0.45.0

Sep 14, 2020

0.44.1

Sep 10, 2020

0.44.0

Aug 28, 2020

0.43.2

Aug 19, 2020

0.43.1

Aug 14, 2020

0.43.0

Aug 14, 2020

0.42.3

Aug 12, 2020

0.42.2

Aug 4, 2020

0.42.1

Jul 19, 2020

0.42.0

Jul 19, 2020

0.41.0

Jul 12, 2020

0.40.0

Jul 12, 2020

0.39.0

Jul 12, 2020

0.38.2

Jul 9, 2020

0.38.1

Jul 9, 2020

0.38.0

Jul 7, 2020

0.37.12

Jul 2, 2020

0.37.11

Jul 1, 2020

0.37.10

Jul 1, 2020

0.37.9

Jul 1, 2020

0.37.8

Jul 1, 2020

0.37.7

Jun 30, 2020

0.37.6

Jun 30, 2020

0.37.5

Jun 29, 2020

0.37.4

Jun 29, 2020

0.37.3

Jun 26, 2020

0.37.2

Jun 21, 2020

0.37.1

Jun 11, 2020

0.37.0

Jun 6, 2020

0.37.0.dev1 pre-release

Jun 5, 2020

0.36.1

May 18, 2020

0.35.2

May 18, 2020

0.35.1

May 18, 2020

0.35.0

May 2, 2020

0.34.0

Mar 9, 2020

0.33.0

Mar 9, 2020

0.32.0

Feb 26, 2020

0.31.0

Feb 25, 2020

0.30.0

Feb 18, 2020

0.29.2

Feb 16, 2020

0.29.1

Jan 31, 2020

0.29.0

Jan 31, 2020

0.28.1

Nov 7, 2019

0.28.0

Aug 7, 2019

0.27.0

Aug 5, 2019

0.26.1

Jun 8, 2019

0.26.0

May 6, 2019

0.25.1

May 5, 2019

0.25.1.dev0 pre-release

May 5, 2019

0.25.0

May 5, 2019

0.24.4

May 3, 2019

0.24.3

Apr 14, 2019

0.24.2

Apr 14, 2019

0.24.1

Apr 2, 2019

0.24.0

Mar 25, 2019

0.23.0

Mar 20, 2019

0.22.1

Feb 1, 2019

0.22.1.dev0 pre-release

Aug 31, 2018

0.22.0

Aug 31, 2018

0.21.5

May 29, 2018

0.21.4

Apr 2, 2018

0.21.3

Mar 30, 2018

0.21.2

Mar 8, 2018

0.21.2.dev0 pre-release

Mar 7, 2018

0.21.0

Mar 6, 2018

0.20.0

Feb 10, 2018

0.19.0

Feb 3, 2018

0.18.0

Jan 30, 2018

0.18.0.dev0 pre-release

Jan 30, 2018

0.17.4

Jan 26, 2018

0.17.3

Dec 31, 2017

0.17.3.dev0 pre-release

Dec 31, 2017

0.17.1

Jul 19, 2017

0.17.0

Jul 19, 2017

0.16.1

Jul 11, 2017

0.16.0

Jul 8, 2017

0.15.2

Jul 8, 2017

0.15.1

Jun 4, 2017

0.15.0

May 20, 2017

0.14.3

Feb 18, 2017

0.14.3.dev1 pre-release

Feb 13, 2017

0.14.1

Feb 9, 2017

0.14.0

Feb 7, 2017

0.13.6

Jan 28, 2017

0.13.5

Jan 9, 2017

0.13.4

Jan 4, 2017

0.13.2

Dec 27, 2016

0.13.1

Dec 27, 2016

0.13.0

Dec 26, 2016

0.13.0.dev1 pre-release

Dec 26, 2016

0.12.0

Dec 15, 2016

0.11.1.dev4 pre-release

Dec 10, 2016

0.11.1.dev3 pre-release

Dec 10, 2016

0.11.1.dev2 pre-release

Dec 10, 2016

0.11.1.dev1 pre-release

Dec 8, 2016

0.11.0

Dec 5, 2016

0.10.2

Nov 13, 2016

0.10.1

Nov 10, 2016

0.10.0

Nov 10, 2016

0.10.0.dev2 pre-release

Nov 10, 2016

0.10.0.dev1 pre-release

Nov 9, 2016

0.9.1

Nov 2, 2016

0.9.0

Oct 26, 2016

0.9.0.dev1 pre-release

Oct 26, 2016

0.8.8.dev1 pre-release

Oct 26, 2016

0.8.6.dev1 pre-release

Oct 24, 2016

0.8.5.dev1 pre-release

Oct 24, 2016

0.8.3

Sep 27, 2016

0.8.3dev pre-release

Sep 27, 2016

0.8.2

Sep 24, 2016

0.8.1

Sep 17, 2016

0.8.0

Aug 11, 2016

0.7.9

Jul 28, 2016

0.7.8

Jul 22, 2016

0.7.7

Jul 20, 2016

0.7.6

May 30, 2016

0.7.5

Apr 11, 2016

0.7.4

Mar 3, 2016

0.7.3

Feb 24, 2016

0.7.2

Feb 24, 2016

0.7.1

Feb 21, 2016

0.7.0

Feb 15, 2016

0.6.9

Nov 18, 2015

0.6.8

Nov 9, 2015

0.6.7

Nov 8, 2015

0.6.6

Nov 8, 2015

This version

0.6.5

Nov 6, 2015

0.6.4

Nov 6, 2015

0.6.3

Oct 30, 2015

0.6.2

Oct 30, 2015

0.6.1

Oct 21, 2015

0.6.0

Oct 20, 2015

0.5.9

Oct 20, 2015

0.5.8

Oct 20, 2015

0.5.7

Oct 15, 2015

0.5.6.dev0 pre-release

Oct 15, 2015

0.5.5

Sep 30, 2015

0.5.3

Jun 24, 2015

0.5.2

Jun 24, 2015

0.5.1

Jun 24, 2015

0.4.8

Jun 20, 2015

0.4.7

Jun 19, 2015

0.4.6

Jun 16, 2015

0.4.5

May 20, 2015

0.4.4

May 18, 2015

0.4.3

May 17, 2015

0.4.2

May 2, 2015

0.4.1

May 1, 2015

0.4

Apr 26, 2015

0.3.1

Apr 21, 2015

0.2

Apr 16, 2015

0.1.3

Apr 10, 2015

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

wikitextparser-0.6.5.zip (41.3 kB view details)

Uploaded Nov 6, 2015 Source

File details

Details for the file wikitextparser-0.6.5.zip.

File metadata

Download URL: wikitextparser-0.6.5.zip
Upload date: Nov 6, 2015
Size: 41.3 kB
Tags: Source
Uploaded using Trusted Publishing? No

File hashes

Hashes for wikitextparser-0.6.5.zip
Algorithm	Hash digest
SHA256	`a02411df96da39c69b0a27342dd39fab72bc823a0b0550d13f9c58c66052e9e9`
MD5	`1aa68b07b12b25d1777680a81db03b33`
BLAKE2b-256	`db6fe80007afb836dbebf97acb0cbb2d78ade41d34145b82312d9c45fefe3ade`

See more details on using hashes here.

wikitextparser 0.6.5

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Installation

Usage

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

File details

File metadata

File hashes