smart-city-predictions

System prognostyczny dedykowany dla danych inteligentnych miast

Praca inżynierska realizowana przez Michała Stawikowskiego and Witolda Merkela

Abstrakt

Celem pracy było zaprojektowanie i realizacja systemu informatycznego, który wykorzy-stuje środowiska składowania i przetwarzania danych wielkoskalowych (ang. Big Data) dopozyskiwania strumieni danych z inteligentnych miast (ang. Smart City) oraz metody uczeniamaszynowego do prognozowania na podstawie tych danych. System powinien mieć otwartąarchitekturę, która umożliwia dołączanie nowych źródeł danych oraz dołączanie nowychkomponentów, które tworzą zbiory uczące i testowe na potrzeby uczenia modeli klasyfikacyjnychi regresyjnych oraz wykonują prognozy z użyciem tych modeli. Postawione cele zostały zreali-zowane. W ramach systemu zostały zaimplementowane przykładowe komponenty pozyskiwaniadanych z różnych źródeł danych oraz ich składowanie, wykorzystujące uznane platformy BigData. Dodatkowo zostały stworzone przykładowe komponenty, które na podstawie zgroma-dzonych danych wykonują proces uczenia modeli klasyfikacyjnych i regresyjnych, a następniewyznaczają i udostępniają prognozowane wartości oraz statystyki uczenia modeli. W celuprezentacji informacji oraz wyników działania systemu zaimplementowano graficzny interfejsużytkownika. Na pracę składa się dogłębna analiza problemu, przedstawienie procesu projekto-wania systemu, opis działania stworzonych modułów, a także dokładna dokumentacja techniczna.

Przewodnik po repozytorium

data_for_ml - folder zawierający podstawowe operacje na danych. Funkcje zawarte w tym folderze służą przygotowaniu danych do uczenia maszynowego.
flask-with-auth - folder zawierający część aplikacji odpowiedzialną na graficzny interfejs użytkownika. Tutaj znajduje się baza danych użytkowników, kody .html, .css i .js odpowiedzialne za zarzadzanie poszczególnymi stronami oraz serwer w Flask.
flow_authomatization - folder zawierający funkcje odpowiedzialne za zarządzanie procesem trenowania modeli uczenia maszynowego oraz predykcji.
nifi - folder zawierający schematy wykorzystywanych przepływów w Apache NiFi.
spark_ml - zawiera funkcje tworzące modele regresyjne jak i klasyfikatory oraz dokunujące predykcji.
speed_layer - zawiera funkcje zarządzające przetwarzaniem strumieniowym oraz zapisem predykcji do Apache Cassandra.

A forecasting system dedicated to smart city data

Related tags

Overview

smart-city-predictions

Abstrakt

Przewodnik po repozytorium

Owner

Kevin Lai

Statistical Rethinking course winter 2022

CPSPEC is an astrophysical data reduction software for timing

Package for decomposing EMG signals into motor unit firings, as used in Formento et al 2021.

Basis Set Format Converter

This mini project showcase how to build and debug Apache Spark application using Python

💬 Python scripts to parse Messenger, Hangouts, WhatsApp and Telegram chat logs into DataFrames.

Predictive Modeling & Analytics on Home Equity Line of Credit

Gathering data of likes on Tinder within the past 7 days

This cosmetics generator allows you to generate the new Fortnite cosmetics, Search pak and search cosmetics!

DataPrep — The easiest way to prepare data in Python

Monitor the stability of a pandas or spark dataframe ⚙︎

A 2-dimensional physics engine written in Cairo

Intercepting proxy + analysis toolkit for Second Life compatible virtual worlds

A fast, flexible, and performant feature selection package for python.

Python Practicum - prepare for your Data Science interview or get a refresher.

Synthetic data need to preserve the statistical properties of real data in terms of their individual behavior and (inter-)dependences

Approximate Nearest Neighbor Search for Sparse Data in Python!

We're Team Arson and we're using the power of predictive modeling to combat wildfires.

Created covid data pipeline using PySpark and MySQL that collected data stream from API and do some processing and store it into MYSQL database.

Exploratory data analysis