Crawler do site Fundamentus.com com o uso do framework scrapy, tanto da aba detalhada como a de resumo.

Last update: Oct 04, 2022

Overview

Fundamentus com framework scrapy

Crawler do site Fundamentus.com com o uso do framework scrapy, tanto da aba detalhada como a de resumo.

Baixa informacões que os outros scrapys do fundamentus não realizam.

Para iniciar, dentro da pasta fundamentus digite: scrapy crawl detalhes -O nomedoarquivocriado.csv ou scrapy crawl resultado -O nomedoarquivocriado.csv

Não é um codigo elegante, mas funcional, realiza o scrapy de forma rapida.

As informacões baixadas são:

       columns = ['Papel', 'Cotação', 'Tipo', 'Data ult cot', 'Empresa', 'Min 52 sem',
                  'Setor', 'Max 52 sem', 'Subsetor', 'Vol $ méd (2m)', 'Valor de mercado',
                  'Últ balanço processado', 'Valor da firma', 'Nro. Ações',

                  'Dia', 'P/L',
                  'LPA', 'Mês', 'P/VP', 'VPA', '30 dias', 'P/EBIT', 'Marg. Bruta',
                  '12 meses', 'PSR', 'Marg. EBIT', '2021', 'P/Ativos', 'Marg. Líquida',
                  '2020', 'P/Cap. Giro', 'EBIT / Ativo', '2019', 'P/Ativ Circ Liq',
                  'ROIC', '2018', 'Div. Yield', 'ROE', '2017', 'EV / EBITDA',
                  'Liquidez Corr', '2016', 'EV / EBIT', 'Div Br/ Patrim', '2015',
                  'Cres. Rec (5a)', 'Giro Ativos',

                  'Ativo',
                  'Dív. Bruta',
                  'Disponibilidades',
                  'Dív. Líquida',
                  'Ativo Circulante',               
                  'Depósitos',
                  'Cart. de Crédito',
                  'Patrim. Líq',

                  'Receita Líquida_12meses',         
                  'Receita Líquida_3meses', 'EBIT_12meses', 'EBIT_3meses',
                  'Lucro Líquido_12meses', 'Lucro Líquido_3meses']
                  
                  e mais algumas informações...

Realizei este projeto com o fim de aprendizado e por não encontrar no github nenhum scrapy que pegue todas as informaçoes que eu precisava como setores e subsetores para realizar modelos KNN e KMC de machine learning.

Crawler do site Fundamentus.com com o uso do framework scrapy, tanto da aba detalhada como a de resumo.

Related tags

Overview

Fundamentus com framework scrapy

Owner

Guilherme Silva Uchoa

Google Developer Profile Badge Scraper

Scraping and visualising India's real-time COVID-19 data from the MOHFW dataset.

A spider for Universal Online Judge(UOJ) system, converting problem pages to PDFs.

✂️🕷️ Spider-Cut is a Network Mapper Framework (NMAP Framework)

Webservice wrapper for hhursev/recipe-scrapers (python library to scrape recipes from websites)

This repo has the source code for the crawler and data crawled from auto-data.net

此脚本为 python 脚本,实现原理为利用 selenium 定位相关元素,再配合点击事件完成浏览器的自动化.

Haphazard scripts for scraping bitcoin/bitcoin data from GitHub

Dailyiptvlist.com Scraper With Python

联通手机营业厅自动做任务、签到、领流量、领积分等。

Introduction to WebScraping Workshop - Semcomp 24 Beta

A powerful annex BUBT, BUBT Soft, and BUBT website scraping script.

Automated data scraper for Thailand COVID-19 data

爱奇艺会员,腾讯视频,哔哩哔哩,百度,各类签到

Transistor, a Python web scraping framework for intelligent use cases.

Simple python tool for the purpose of swapping latinic letters with cirilic ones and vice versa in txt, docx and pdf files in Serbian language

Anonymously scrapes onlinesim.ru for new usable phone numbers.

Find thumbnails and original images from URL or HTML file.

Automatically download and crop key information from the arxiv daily paper.

Pyrics is a tool to scrape lyrics, get rhymes, generate relevant lyrics with rhymes.