Skip to main content

NCBI数据下载

Project description

安装

pip install ncbi_api

或者

pip install ncbi_api -i https://pypi.python.org/simple

使用

Geo数据下载

series_matrix

  • example1

    from ncbi_api.geo import GeoDownloader, GeoDataType
    
    
    accessions = ['GSE113138', 'GSE171935', 'GSE164612', 'GSE166066']
    
    
    geo = GeoDownloader(accession_list=accessions)
    geo.run(data_type=GeoDataType.SeriesMatrix, workers=4)
    
  • 运行

    -*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*-
    正在读取 Accession 列表
    	--> 共有 Accession 数量4
    -*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*-
    成功读取并完成过滤 -> takes 0.104 seconds
    https://ftp.ncbi.nlm.nih.gov/geo/series/GSE166nnn/GSE166066/matrix/
    https://ftp.ncbi.nlm.nih.gov/geo/series/GSE171nnn/GSE171935/matrix/
    https://ftp.ncbi.nlm.nih.gov/geo/series/GSE113nnn/GSE113138/matrix/
    https://ftp.ncbi.nlm.nih.gov/geo/series/GSE164nnn/GSE164612/matrix/
    GSE113138 200
    

GSE164612 200 GSE171935 200 GSE166066 200 -------------------------------------------- 正在读取 Accession 列表 --> 共有 Accession 数量:4, 成功下载:4, 下载失败(404):0, 还剩:0 -------------------------------------------- 成功读取并完成过滤 -> takes 0.046 seconds -------------------------------------------- 正在读取 url 列表 --> 共有 url 数量:4 -------------------------------------------- 成功读取并完成过滤 -> takes 0.004 seconds 正在下载 -> GSE113138_series_matrix.txt.gz -> 3.18 KB: 4KB [00:00, 1999.91KB/s]
正在下载 -> GSE166066_series_matrix.txt.gz -> 3.01 KB: 4KB [00:00, 1333.64KB/s]
正在下载 -> GSE164612_series_matrix.txt.gz -> 2.21 MB: 21%|█ | 465/2258 [00:31<02:02, 14.60KB/s]


- example2

```python
from ncbi_api.geo import GeoDownloader, GeoDataType


accessions = ['GSE113138', 'GSE171935', 'GSE164612', 'GSE166066']


geo = GeoDownloader(accession_list=accessions)
geo.run(data_type=GeoDataType.SeriesMatrix, workers=4, series_matrix_url_filepath='history/series_matrix_urls.txt')
  • 运行

    -*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*-
    正在读取 url 列表
    	--> 共有 url 数量:4, 成功下载:3, 下载失败(404):0,  还剩:1
    -*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*--*-
    成功读取并完成过滤 -> takes 0.002 seconds
    
    正在下载 -> GSE171935_series_matrix.txt.gz -> 1.86 KB: 2KB [00:00, 666.93KB/s]                     
    正在下载 -> GSE113138_series_matrix.txt.gz -> 3.18 KB: 4KB [00:00, 1335.45KB/s]                   
    正在下载 -> GSE166066_series_matrix.txt.gz -> 3.02 KB: 4KB [00:00, 14.50KB/s]                     
    正在下载 -> GSE164612_series_matrix.txt.gz -> 2.21 MB:  49%|█▉  | 1105/2258 [00:46<00:28, 41.07KB/s]
    

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ncbi_api-0.1.tar.gz (5.0 kB view hashes)

Uploaded Source

Built Distribution

ncbi_api-0.1-py3-none-any.whl (6.0 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page