Avocado hass time series vs predict price

Overview

AVOCADO HASS TIME SERIES VÀ PREDICT PRICE

Trước khi vào Heroku muốn giao diện đẹp mọi người chuyển giúp mình theo hình bên dưới image

predict_avocado

https://avocado-hass.herokuapp.com/ deployed to Heroku

Please change setting to theme dark

Nếu trường muốn coi trên máy local host thì làm các bước sau:

Bước 1: Down code trên github về Bước 2: Vào trang streamlit để thực hiện theo hướng dẫn của treamlit: https://docs.streamlit.io/library/get-started/installation

I. TỔNG QUAN VỀ HỆ THỐNG DỮ LIỆU

  1. Mục đích
    • Dự đoán giá bơ trung bình của bơ "Hass" ở Mỹ
    • Xem xét mở rộng các loại trang trại Bơ đang có trong việc trồng bơ ở các vùng khác
    • Xây dựng mô hình dự báo giá trùng bình của bơ "Hass" ở Mỹ sau đó xem xét việc mở rộng sản xuất kinh doanh
  2. Vi sao có dự án nào ?
    • Ai (Who): Doanh nghiệp là người cần
    • Tại sao (Why): Giá bơ biến động ở các vùng khác nhau ? Có nên trồng bơ các vùng đó không ?
  3. Hiện tại
    • Công ty kinh doanh quả bơ ở rất nhiều vùng của nước Mỹ có 2 loại bơ: Bơ thường và bơ hữu cơ
    • Quy cách đóng gọi theo nhiều quy chuẩn: Small/ Large/ Xlarge Bags
    • Có 3 loại item (product look up) khác nhau: 4046, 4225, 4770
  4. Vấn đề
    • Doanh nghiệp chưa có mô hình dự báo giá bơ cho việc mở rộng
    • Tối ưu sao việc tiếp cận giá bơ tới người tiêu dùng thấp nhất
  5. Thách thức và cách tiếp cận - Challenge and Approach
    • Dữ liệu được lấy trực tiếp từ máy tính tính tiền của các nhà bán lẻ dựa trên doanh số bán lẻ thực tế của bơ Hass
    • Dữ liệu đại diện cho dữ liệu lấy từ máy quét bán lẻ hàng tuần cho lượng bán lẻ (National retail volumn - units) và giá bơ từ tháng 4/2015 đến tháng 3/2018
    • Giá Trung bình (Average Price) trong bảng phản ánh giá trên một đơn vị (mỗi quả bơ), ngay cả khi nhiều đơn vị (bơ) được bán trong bao
    • Mã tra cứu sản phẩm - Product Lookup codes (PLU’s) trong bảng chỉ dành cho bơ Hass, không dành cho các sản phẩm khác.
  6. Data obtained - Thu thập dữ liệu
    • Không thông quan nguồn cào data
    • Toàn bộ dữ liệu được đổ ra và lưu trữ trong tập tin avocado.csv với 18249 record.
    • Có 2 loại bơ trong tập dữ liệu và một số vùng khác nhau. Điều này cho phép chúng ta thực hiện tất cả các loại phân tích cho các vùng khác nhau hoặc phân tích toàn bộ nước mỹ theo một trong 2 loại bơ
  7. Đặt ra yêu cầu với bài toán

Yêu cầu 1: Với bài toán 1: thực hiện dự đoán giá bơ trung bình

  • Thực hiện các tiền xử lý dữ liệu bổ sung (nếu cần)
  • Ngoài những thuật toán regression đã được thực hiện, có thuật toán nào khác cho kết quả tốt hơn không? Thực hiện với thuật toán đó. Tổng hợp kết quả thu được."

Yêu cầu 2: Với bài toán 2: Thực hiện dự đoán giá, khả năng mở rộng trong tương lai với Organic Avocado ở vùng California

Yêu cầu 3: Hãy làm tiếp phần dự đoán giá bơ thường (Conventiton Avocado) của vùng California

Yêu cầu 4: Hãy chọn ra 1 vùng (Trong danh sách các vùng bơ "Hass" đang kinh doanh) mà bạn cho rằng trong tương lai có thể trong trọt, sản xuất kinh doanh (organic và/ hoặc Conventional Avocado). Hãy chứng minh đều này bằng cách triển khai các bài toán như đã với vùng california

II. TỔNG QUAN VỀ THỊ TRƯỜNG

  1. Thị trường Hoa Kỳ image
  2. Mục tiêu và cấn tiếp cận image
  3. Ai là người và cần gì ? image
  4. Kết luận image

III. HƯỚNG DẪN SỬ DỤNG VÀ CHỌN CÁC TÍNH NĂNG DỰ ĐOÁN GIÁ BƠ

image

Owner
hieulmsc
Supply chain management and finance, costing analysis
hieulmsc
Simple structured learning framework for python

PyStruct PyStruct aims at being an easy-to-use structured learning and prediction library. Currently it implements only max-margin methods and a perce

pystruct 666 Jan 03, 2023
A linear regression model for house price prediction

Linear_Regression_Model A linear regression model for house price prediction. This code is using these packages, so please make sure your have install

ShawnWang 1 Nov 29, 2021
Pytools is an open source library containing general machine learning and visualisation utilities for reuse

pytools is an open source library containing general machine learning and visualisation utilities for reuse, including: Basic tools for API developmen

BCG Gamma 26 Nov 06, 2022
A simple and lightweight genetic algorithm for optimization of any machine learning model

geneticml This package contains a simple and lightweight genetic algorithm for optimization of any machine learning model. Installation Use pip to ins

Allan Barcelos 8 Aug 10, 2022
Machine-learning-dell - Repositório com as atividades desenvolvidas no curso de Machine Learning

📚 Descrição Neste curso da Dell aprofundamos nossos conhecimentos em Machine Learning. 🖥️ Aulas (Em curso) 1.1 - Python aplicado a Data Science 1.2

Claudia dos Anjos 1 Jan 05, 2022
TensorFlow Decision Forests (TF-DF) is a collection of state-of-the-art algorithms for the training, serving and interpretation of Decision Forest models.

TensorFlow Decision Forests (TF-DF) is a collection of state-of-the-art algorithms for the training, serving and interpretation of Decision Forest models. The library is a collection of Keras models

538 Jan 01, 2023
A data preprocessing and feature engineering script for a machine learning pipeline is prepared.

FEATURE ENGINEERING Business Problem: A data preprocessing and feature engineering script for a machine learning pipeline needs to be prepared. It is

Pinar Oner 7 Dec 18, 2021
Home repository for the Regularized Greedy Forest (RGF) library. It includes original implementation from the paper and multithreaded one written in C++, along with various language-specific wrappers.

Regularized Greedy Forest Regularized Greedy Forest (RGF) is a tree ensemble machine learning method described in this paper. RGF can deliver better r

RGF-team 363 Dec 14, 2022
CS 7301: Spring 2021 Course on Advanced Topics in Optimization in Machine Learning

CS 7301: Spring 2021 Course on Advanced Topics in Optimization in Machine Learning

Rishabh Iyer 141 Nov 10, 2022
This machine learning model was developed for House Prices

This machine learning model was developed for House Prices - Advanced Regression Techniques competition in Kaggle by using several machine learning models such as Random Forest, XGBoost and LightGBM.

serhat_derya 1 Mar 02, 2022
Self Organising Map (SOM) for clustering of atomistic samples through unsupervised learning.

Self Organising Map for Clustering of Atomistic Samples - V2 Description Self Organising Map (also known as Kohonen Network) implemented in Python for

Franco Aquistapace 0 Nov 16, 2021
Python module for performing linear regression for data with measurement errors and intrinsic scatter

Linear regression for data with measurement errors and intrinsic scatter (BCES) Python module for performing robust linear regression on (X,Y) data po

Rodrigo Nemmen 56 Sep 27, 2022
A Python package to preprocess time series

Disclaimer: This package is WIP. Do not take any APIs for granted. tspreprocess Time series can contain noise, may be sampled under a non fitting rate

Maximilian Christ 57 Dec 17, 2022
scikit-learn: machine learning in Python

scikit-learn is a Python module for machine learning built on top of SciPy and is distributed under the 3-Clause BSD license. The project was started

neurodata 3 Dec 16, 2022
Given the names and grades for each student in a class N of students, store them in a nested list and print the name(s) of any student(s) having the second lowest grade.

Hackerank-Nested-List Given the names and grades for each student in a class N of students, store them in a nested list and print the name(s) of any s

Sangeeth Mathew John 2 Dec 14, 2021
ML Optimizers from scratch using JAX

Toy implementations of some popular ML optimizers using Python/JAX

Shreyansh Singh 38 Jul 29, 2022
A fast, scalable, high performance Gradient Boosting on Decision Trees library, used for ranking, classification, regression and other machine learning tasks for Python, R, Java, C++. Supports computation on CPU and GPU.

Website | Documentation | Tutorials | Installation | Release Notes CatBoost is a machine learning method based on gradient boosting over decision tree

CatBoost 6.9k Jan 05, 2023
Machine-care - A simple python script to take care of simple maintenance tasks

Machine care An simple python script to take care of simple maintenance tasks fo

2 Jul 10, 2022
The Simpsons and Machine Learning: What makes an Episode Great?

The Simpsons and Machine Learning: What makes an Episode Great? Check out my Medium article on this! PROBLEM: The Simpsons has had a decline in qualit

1 Nov 02, 2021
Programming assignments and quizzes from all courses within the Machine Learning Engineering for Production (MLOps) specialization offered by deeplearning.ai

Machine Learning Engineering for Production (MLOps) Specialization on Coursera (offered by deeplearning.ai) Programming assignments from all courses i

Aman Chadha 173 Jan 05, 2023