Skip to main content

site auditor

Project description

Site Auditor
============

Для чего
--------
Этот инструмент необходим для анализа и аудита сайтов. Осуществляет быстрый и качественный сбор информации в автоматическом режиме, достаточно указать цель.

Особенности
-----------
- Open Source
- WHOIS
- ip, title, description, keywords, web-server, powered by, content language, content type
- Яндекс ТИЦ, Google PR, Alexa rank (во всем мире/в отдельной стране)
- Проверка на наличие в каталогах Яндекс, Mail, Yahoo, DMOZ, TDP
- Количество ссылок в Яндекс Блоги (часто требует капчу), Google, Яндекс (сколько проиндексировано всего (часто требует капчу)/попаввшие в индекс), Yahoo, Bing (в индексе, кол-во исходящих ссылок)
- Проверка установки Яндекс метрики, Google Analytics, Live Internet, Rambler TOP100, Mail Rating
- Проверка существования страниц авторизации - Joomla, WordPress, UMI.CMS, Ucoz, Bitrix, /admin, /login, MODX, DLE, Drupal, ISP Manager
- Вывод ``sitemap.xml`` и ``robots.txt``, если существуют.
- W3C HTML validator
- Безопасный просмотр

Пример работы
-------------
.. code-block::

Enter site, please: google.ru
Full scan? y/n y
==================================================
WHOIS
==================================================
domain: GOOGLE.RU
nserver: ns1.google.com.
nserver: ns2.google.com.
nserver: ns3.google.com.
nserver: ns4.google.com.
state: REGISTERED, DELEGATED, VERIFIED
org: Google Inc.
registrar: RU-CENTER-REG-RIPN
admin-contact: https://www.nic.ru/whois
created: 2004.03.04
paid-till: 2014.03.05
free-date: 2014.04.05
source: TCI

nic-hdl: RU-CENTER-REG-RIPN
org: Regional Network Information Center
phone: +7 495 737 0601
fax-no: +7 495 737 0602
e-mail: ru-bill@nic.ru
www: https://www.nic.ru/whois
whois: whois.nic.ru
source: TCI

Last updated on 2014.02.09 16:31:33 MSK
==================================================
Base site information
==================================================
Site ip - 87.245.196.177
Web Server - gws
Powered by - NO
Content Language - NO
Content Type - text/html; charset=UTF-8
Site title - Google
Description - NO
Key words - NO
W3C HTML validator - 26 Errors, 3 warning(s)
==================================================
Ranks
==================================================
Yandex TYC - 64000
Google Page Rank - 7
Alexa Rank in all world - 42
Alexa Rank in Russia - 3
==================================================
Catalogs
==================================================
Yandex Catalog - YES
Mail Catalog - YES
Yahoo Catalog - NO
DMOZ Catalog - YES, 16
TDP Catalog - YES
==================================================
Links
==================================================
Yandex Blog links - 418563
Proindexirovano v Google - примерно 1340000
Proindexirovano v Yandex - 2 млн
Popavshie v index Yandex - 123875
Yahoo index - 3,320,000
Bing index - 3190000
Bing Outgoing Links - 59600
==================================================
Stats
==================================================
Yandex Metrika - NO
Google Analytics - NO
Live Internet - NO
Rambler TOP100 - NO
Mail Rating - NO
==================================================
Admins
==================================================
Joomla Admin Directory - NO
WordPress Admin Directory - NO
UMI.CMS Admin Directory - NO
Ucoz Admin Directory - NO
Bitrix Admin Directory - NO
Simple Login Page - NO
Simple Admin Login Page - NO
MODX Admin Directory or ISP Manager - NO
DLE Admin Directory - NO
Drupal Login page - NO
==================================================
Safe Browsing
==================================================
Google - NO - В настоящее время этот сайт не занесен в список подозрительных. NO - За последние 90 дней на этом сайте не размещалось вредоносное ПО.
Yandex - Сайт google.ru не заражён, либо подробности заражения ещё не опубликованы
Site Advisor - This link is safe. We tested it and didn't find any significant security issues
==================================================
Files
==================================================
Robots.txt: EMPTY
SiteMap XML: EMPTY
==================================================
All Time - 14.97 seconds
==================================================


Установка
---------

Для работы **Site Auditor** необходим `Requests <https://github.com/kennethreitz/requests>`_ и Python 3.

Вы можете `скачать <https://github.com/stleon/OmgSite/archive/master.zip>`_ текущую версию (все самое новое). Или вы также способны на следующее:

.. code-block::

pip install requests
pip install site-auditor


Как пользоваться
----------------

На данный момент мы на стадии **Pre-Alpha**. Вы можете увидеть сообщения об ошибках и т.д. Но **Site Auditor** работает на
большинстве протестированных мной сайтов.

.. code-block::

cd site_auditor
python site_auditor.py

Куда будет развиваться
----------------------
Планируем сделать:

- Web-приложение
- Анализ позиций сайтов по запросам
- Статистика по каждому запросу
- Возможность ранжирования запросов
- Система контроля работы сайта с оповещением

Copyright (C) 2014 ST LEON

email: leonst998@gmail.com

web site: http://omgit.ru

История изменений
=================

1.3.0 (26.02.2014)
-----------------
Добавлено:

- 2 вида сканирования - полное и частичное

1.2.6 - 1.2.7 (25.02.2014)
-----------------
Добавлено:

- Docs fix

1.2.5 (19.02.2014)
-----------------
Добавлено:

- Site Advisor

1.2.4 (17.02.2014)
-----------------
Добавлено:

- Вывод времени, затраченного на анализ

1.2.3 (11.02.2014)
-----------------
Добавлено:

- Поиск чистого домена

1.2.2 (11.02.2014)
-----------------
Добавлено:

- Исходящие ссылки Bing
- Страницы в индексе Bing


1.2.1 (11.02.2014)
-----------------
Добавлено:

- TDP Catalog
- Yahoo index

1.2.0 (10.02.2014)
-----------------
Добавлено:

- Безопасный просмотр

1.1.2 (10.02.2014)
-----------------
Удалено:

- Неиспользуемый код

1.1.1 (10.02.2014)
-----------------
Добавлено:

- Новая функция парсера

1.1.0 (09.02.2014)
-----------------
Добавлено:

- ``Microdata`` в тестовом режиме
- Обновлены доки

1.0.5 (09.02.2014)
-----------------
Добавлено:

- Теперь строковое представление объекта можно настраивать в ``out.txt``
- Обновлены доки

1.0.4 (08.02.2014)
-----------------
Исправлено:

- Никаких "!№" и тд в домене

1.0.3 (08.02.2014)
-----------------
Исправлено:

- Домен не менее 4х символов
- ``www`` теперь не удаляются

1.0.2 (07.02.2014)
-----------------
Исправлено:

- Домен не длиннее 255 символов
- Работа с доменами, написанными на кириллице

1.0.1 (07.02.2014)
-----------------
Изменения:

- Нет u'', так как Python 3

1.0.0 (07.02.2014)
-----------------
Изменения:

- Переход на Python 3.3

0.2.1 (05.02.2014)
-----------------
Добавлено:

- W3C HTML validator

0.2.0 (05.02.2014)
-----------------
Добавлено:

- Whois

0.1.0 (04.02.2014)
-----------------
Добавлено:

- Проверка существования страниц авторизации MODX, DLE, Drupal, ISP Manager

0.0.1 (04.02.2014)
-----------------
Добавлено:

- класс ``SiteAuditor`` и класс ``MetaHTMLParser``

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

site-auditor-1.3.1.zip (15.5 kB view hashes)

Uploaded Source

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page