import requests
from bs4 import BeautifulSoup
import json
import pandas as pd
import re
import os
import matplotlib.pyplot as plt
import seaborn as sns
from mpl_toolkits.mplot3d import Axes3D
import numpy as np
import matplotlib.cm as cm
import ast
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, roc_auc_score
import matplotlib.pyplot as plt
import re


def get_data_shop(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        data = dict(r.json())
        return data['results_html']
    except requests.exceptions.RequestException as e:
        return None


def get_data_page(url):
    response = requests.get(url)
    if response.status_code == 200:
        return response.text
    else:
        return None


non_genre_tags = ['Singleplayer', 'Multiplayer', 'Online Pvp', 'Co-op', 'Online Co-Op', 'VR', 'Free to Play','Local Multiplayer', 'Local Co-Op', 'Massively Multiplayer']
num_player_tags = ['Singleplayer', 'Multiplayer', 'Online Pvp', 'Co-op', 'Online Co-Op', 'Local Multiplayer', 'Local Co-Op', 'Massively Multiplayer']
num_feature_tags = ['Single-player', 'Multi-player', 'PvP', 'Online PvP', 'Lan PvP', 'Shared/Split Screen PvP', 'Co-op',
                     'Online Co-op', 'Lan Co-op', 'Shared/Split Screen Co-op', 'Shared/Split Screen', 'Cross-Platform Multiplayer']
vr_tags = ['VR Only', 'VR Supported']

top_seller_url = 'https://store.steampowered.com/search/?filter=topsellers&os=win'
top_seller_data = get_data_page(top_seller_url)
top_titles = []

if top_seller_data:
    top_seller_soup = BeautifulSoup(top_seller_data, 'html.parser')
    top_seller_titles = top_seller_soup.find_all('span', {'class': 'title'})
    for top_seller in top_seller_titles:
        top_title = top_seller.text.strip()
        top_titles.append(top_title)


def parse(data):
    global top_titles
    data_file =  []
    soup = BeautifulSoup(data, 'html.parser')
    games = soup.find_all('a', limit= 50)

    for game in games:
        
        new_url = game['href']

        new_data = get_data_page(new_url)
        if new_data:
             new_game = BeautifulSoup(new_data, 'html.parser')
             title = new_game.find('div', {'class': 'apphub_AppName'})
             if title:
                title = title.text.strip()
             else:
                title = '-'
        else:
            break   

        discounted_price = new_game.find('div', {'class': 'discount_original_price'})
        if discounted_price:
            original_price =  discounted_price.text.strip()      

        else:
            original_price = new_game.find('div', {'class':'game_purchase_price'})
            if original_price:
                original_price =  original_price.text.strip()  
            else:
                original_price = '-'

        possible_tags = new_game.find_all('a', {'class': 'app_tag'})
        genres = []
        features = []
        num_of_players = []
        VR_Support = False
        cross_platform = False
        
        if possible_tags:
            for tag in possible_tags:
                tag = tag.text.strip()
                if (tag in non_genre_tags):
                    if (tag in num_player_tags):
                        num_of_players.append(tag)
                    
                    elif (tag == 'VR'):
                        VR_Support = True

                    continue

                else:
                  genres.append(tag)
        
        possible_features = new_game.find_all('div', {'class': 'label'})
        if possible_features:
            for feature in possible_features:
                feature = feature.text.strip()
                if feature == ('Cross-Platform Multiplayer'):
                    cross_platform = True

                elif feature in num_feature_tags and feature not in num_of_players:
                    num_of_players.append(feature)

                elif feature in vr_tags:
                  VR_Support = True

                else:
                    features.append(feature)


        devs = []
        pubs = []
        total_dev_followers = 0
        total_pub_followers = 0
        total_followers = 0

        all_elements = new_game.find_all('div', {'class': 'dev_row'})
        if all_elements:
            developer_elements = all_elements[0]
            temp_urls = developer_elements.find_all('a')
            if(temp_urls):
                for temp_url in temp_urls:
                    dev_name = temp_url.text.strip()
                    dev_url = temp_url['href']
                    dev_data = get_data_page(dev_url)
                    if (dev_data is not None):
                        new_dev = BeautifulSoup(dev_data, 'html.parser')
                        if(new_dev):
                            dev_followers = new_dev.find('div', {'class':'num_followers'})
                            if dev_followers:
                                dev_followers = dev_followers.text.strip()
                                total_dev_followers += int (dev_followers.replace(',', ''))

                            else:   
                                 dev_followers = 0
                        if(dev_name):
                            devs.append(dev_name)
                        else:
                            devs.append('-')
                    else:
                            devs.append('-')    

            else:
                devs.append('-')
                                 
            if (len(all_elements) > 1):
                publisher_elements =  all_elements[1] 
                temp_urls= publisher_elements.find_all('a')
                if (temp_urls):
                    total_followers = total_dev_followers
                    for temp_url in temp_urls:
                        pub_name = temp_url.text.strip()
                        pub_url = temp_url['href']
                        pub_data = get_data_page(pub_url)
                        if (pub_data is not None):
                            new_pub = BeautifulSoup(pub_data, 'html.parser')
                            if(new_pub):
                                pub_followers = new_pub.find('div', {'class':'num_followers'})
                                if pub_followers:
                                    pub_followers = pub_followers.text.strip() 
                                    total_pub_followers += int (pub_followers.replace(',', ''))
                                    if pub_name not in devs:
                                        total_followers += total_pub_followers
                                    else:
                                        pub_followers = 0
                            if (pub_name):
                                pubs.append(pub_name)
                            else:
                                pubs.append('-')
                        else:
                            pubs.append('-')
                else:
                    pubs.append('-')
            else:
                pubs.append('-')
        

        release_date = new_game.find('div', {'class':'date'})
        if release_date:
            release_date = release_date.text.strip()
        else:
            release_date = '-'

        reviews = new_game.find_all('span', {'class': 'nonresponsive_hidden responsive_reviewdesc'})
        if reviews:
            for i, review in enumerate(reviews):
                if i == 1:  
                    review_text = review.text.strip()
                    review_score = re.search("\d+", review_text)
                    if review_score:
                        review_score = review_score.group(0) + '%'
                    else:
                        review_score = '-'
                    review_numbers = new_game.find('div', {'class':'user_reviews'})
                    review_numbers = review_numbers.find_all('span', {'class': 'responsive_hidden'})
                    if review_numbers:
                        review_numbers = int (review_numbers[1].text.strip().replace(',', '').replace('-','').replace('(','').replace(')',''))
                    else:
                        review_numbers = '-'
                    break
                else:
                    review_numbers = '-'
                    review_score = '-'
        else:
            review_numbers = '-'
            review_score = '-'
        

        possible_languages = new_game.find_all('td', {'class': 'ellipsis'})
        if possible_languages:
            languages = [language.text.strip() for language in possible_languages]
        else:
            languages = '-'

        if title in top_titles:
            title_index = top_titles.index(title) 
            top_seller = title_index + 1
        else:
            top_seller = '-'

            
        our_data = {
            'Title': title,
            'Price': original_price,
            'Geners': genres,
            'Num of Players': num_of_players,
            'Features': features,
            'VR support': VR_Support,
            'Cross Platform': cross_platform,
            'Developers': devs,
            'Developers Followers': total_dev_followers,
            'Publishers': pubs,
            'Publishers Followers': total_pub_followers,
            'Total Followers': total_followers,
            'Release Date': release_date,
            'Review Score': review_score,
            'Number of Reviews': review_numbers,
            'Languages': languages,
            'Selling Rank': top_seller
            }

        data_file.append(our_data)
            
                            
    return data_file


def output(ourdata, filepath):
    if ourdata:
        df_new = pd.DataFrame(ourdata)
        if not os.path.isfile(filepath):
            df_new.to_csv(filepath, index=False)
        else:
            df = pd.read_csv(filepath)
            df = pd.concat([df, df_new], ignore_index=True)
            df.to_csv(filepath, index=False)
        print('Done!')
    else:
        print('No data to save.')


filepath = 'gamedata.csv'
ourdata = []
for x in range(0, 55000, 50):
   data = get_data_shop(f'https://store.steampowered.com/search/results/?query&start={x}&count=50&dynamic_data=&sort_by=_ASC&snr=1_7_7_230_7&category1=998&supportedlang=english&infinite=1')
   if data is None:
        continue
   else:
        ourdata.extend(parse(data))
        print('Results Scraped:', x+50)

   if len(ourdata) > 0:
        output(ourdata, filepath)
        ourdata = []


def review_parse(data):
    data_file = []
    soup = BeautifulSoup(data, 'html.parser')
    games = soup.find_all('div', {'class': 'responsive_search_name_combined'}, limit=50)

    for game in games:
        title = game.find('span', {'class': 'title'})
        if title:
            title = title.text.strip()
        else:
            title = '-'

        print(title)

        class_names = ['positive', 'mixed', 'negative']
        percentage = "-"
        num_reviews = "-"
        found_match = False

        for class_name in class_names:
            reviews = game.find_all('span', {'class': 'search_review_summary ' + class_name})
            if reviews:
                tooltip_html = reviews[0]['data-tooltip-html']
                review_score_match = re.search(r'\b(\d+)%', tooltip_html)
                num_reviews_match = re.search(r'(\d+(?:,\d+)*)\s+user reviews', tooltip_html)

                if review_score_match:
                    percentage = review_score_match.group(1) + '%'
                    found_match = True

                if num_reviews_match:
                    num_reviews = num_reviews_match.group(1).replace(',', '')
                    found_match = True

                if found_match:
                    break


        our_data = {
            'Title': title,
            'Review Score': percentage,
            'Number of Reviews': num_reviews,
        }

        data_file.append(our_data)

    return data_file


filepath = 'review_gamedata.csv'
ourdata = []
for x in range(0, 55000, 50):
   data = get_data_shop(f'https://store.steampowered.com/search/results/?query&start={x}&count=50&dynamic_data=&sort_by=_ASC&snr=1_7_7_230_7&category1=998&supportedlang=english&infinite=1')
   if data is None:
        continue
   else:
        ourdata.extend(review_parse(data))
        print('Results Scraped:', x+50)

   if len(ourdata) > 0:
        output(ourdata, filepath)
        ourdata = []


df_base = pd.read_csv('filtered_gamedata.csv')
df_new = pd.read_csv('review_gamedata.csv')

for index, row in df_base.iterrows():
    title = row['Title']
    
    matching_row = df_new[df_new['Title'] == title]

    if not matching_row.empty:
        review_score = matching_row.iloc[0]['Review Score']
        num_reviews = matching_row.iloc[0]['Number of Reviews']

        df_base.at[index, 'Review Score'] = review_score
        df_base.at[index, 'Number of Reviews'] = num_reviews

df_base.to_csv('done_gamedata.csv', index=False)


df = pd.read_csv('done_gamedata.csv')


df_genre = pd.read_csv('Genresdata.csv')

mapping_dict = {}
categories = df_genre.columns.tolist()
for category in categories:
    sub_genres = df_genre[category].dropna().tolist()
    for sub_genre in sub_genres:
        mapping_dict[sub_genre.strip(" ").strip("'")] = category.strip(" ").strip("'")


updated_df = df.copy()

for index, row in df.iterrows():
    genre_list = []
    row_list = row['Genres'].split(',') 
    mapped_genres = set() 

    for genre in row_list:
        genre = genre.strip("[]").strip("'").strip(" ").strip("'")
        if genre in mapping_dict:
            mapped_genre = mapping_dict[genre]
            if mapped_genre and mapped_genre != 'Delete' and mapped_genre not in mapped_genres:
                genre_list.append(mapped_genre)
                mapped_genres.add(mapped_genre)
        else:
            genre_list.append(genre)
    
    genre_list = list(set(genre_list))
    genre_list = [genre for genre in genre_list if genre]
    updated_df.at[index, 'Genres'] = genre_list

updated_df.to_csv('updated_gamedata.csv', index=False)


df = pd.read_csv('updated_gamedata.csv')

df['Price'] = df['Price'].astype(str)

df['Price'] = df['Price'].str.replace('₪', '')

df['Price'] = df['Price'].str.lower().replace(['free', 'free to play'], '0')

df['Price'] = pd.to_numeric(df['Price'], errors='coerce')

df['Price'] = np.round(df['Price'], decimals=0)

df['Release Season'] = df['Release Date'].str.split(',').str[0].str.split().str[1].map({
    'Mar': '1', 'Apr': '1', 'May': '1',
    'Jun': '2', 'Jul': '2', 'Aug': '2',
    'Sep': '3', 'Oct': '3', 'Nov': '3',
    'Dec': '4', 'Jan': '4', 'Feb': '4'
})
df['Release Year'] = df['Release Date'].str.split().str[-1]

df = df.drop('Release Date', axis=1)

df['Number of Languages'] = df['Languages'].apply(lambda x: len(ast.literal_eval(x)))

df['Review Score'] = pd.to_numeric(df['Review Score'].str.rstrip('%'), errors='coerce')

df['Selling Rank'] = pd.to_numeric(df['Selling Rank'], errors='coerce')

for index, row in df.iterrows():
    selling_rank = row['Selling Rank']
    developers = row['Developers']
    publishers = row['Publishers']
    
    if pd.isna(selling_rank):
        df.at[index, 'Developers'] = 'Small developer'
        
        df.at[index, 'Publishers'] = 'Small publisher'

df.to_csv('modified_gamedata.csv', index=False)


# Read the CSV file
df = pd.read_csv('modified_gamedata.csv')


plt.figure(figsize=(10, 6))
bins = list(range(0, 110, 10)) 
sns.histplot(df['Review Score'], bins=bins, kde=True)
plt.xlabel('Review Score')
plt.ylabel('Count')
plt.title('Distribution of Review Scores')
plt.xticks(bins, [f"{x}%" for x in bins])  
plt.xlim(0, 100)
plt.show()


    score_intervals = np.arange(0, 101, 10)

    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 6))

    sc1 = ax1.scatter(df['Review Score'], df['Number of Reviews'], c=df['Selling Rank'], cmap='viridis', alpha=0.7)
    ax1.set_xlabel('Review Score')
    ax1.set_ylabel('Number of Reviews')
    ax1.set_title('Games in the Ranking (Colored by Selling Rank)')
    plt.colorbar(sc1, ax=ax1, label='Selling Rank')

    max_num_reviews = df['Number of Reviews'].max()
    max_y_limit = (max_num_reviews // 100000 + 1) * 100000
    ax1.set_ylim(0, max_y_limit)
    ax1.set_yticks(np.arange(0, max_y_limit + 100000, 200000))

    sc2 = ax2.scatter(df[df['Selling Rank'].isnull()]['Review Score'], df[df['Selling Rank'].isnull()]['Number of Reviews'],
                c='gray', marker='o', alpha=0.5)
    ax2.set_xlabel('Review Score')
    ax2.set_ylabel('Number of Reviews')
    ax2.set_title('Games Not in the Ranking')

    ax1.set_xticks(score_intervals)
    ax2.set_xticks(score_intervals)

    plt.tight_layout()
    plt.show()


    df['Selling Rank'] = pd.to_numeric(df['Selling Rank'], errors='coerce')
    df['Review Score'] = pd.to_numeric(df['Review Score'], errors='coerce')

    df_sorted = df.sort_values('Selling Rank', ascending=False)

    top_10_threshold = int(len(df_sorted) * 0.1)

    top_10_percent = df_sorted.head(top_10_threshold)

    remaining_games = df_sorted.tail(len(df_sorted) - top_10_threshold)

    avg_top_10_score = top_10_percent['Review Score'].mean()
    avg_top_10_reviews = top_10_percent['Number of Reviews'].mean()

    avg_remaining_score = remaining_games['Review Score'].mean()
    avg_remaining_reviews = remaining_games['Number of Reviews'].mean()

    print("Average Score for Top 10% of Top Ranking Games:", avg_top_10_score)
    print("Average Number of Reviews for Top 10% of Top Ranking Games:", avg_top_10_reviews)
    print("Average Score for Remaining Games:", avg_remaining_score)
    print("Average Number of Reviews for Remaining Games:", avg_remaining_reviews)

    unranked_games = df_sorted[df_sorted['Selling Rank'].isnull()]

    if len(unranked_games) > 0:
        unranked_score_copy = unranked_games['Review Score'].copy()

        unranked_score_copy = pd.to_numeric(unranked_score_copy, errors='coerce')

        unranked_score_copy = unranked_score_copy.fillna(1)

        avg_unranked_score = unranked_score_copy.mean()
        avg_unranked_reviews = unranked_games['Number of Reviews'].mean()
        print("Average Score for Unranked Games:", avg_unranked_score)
        print("Average Number of Reviews for Unranked Games:", avg_unranked_reviews)

Average Score for Top 10% of Top Ranking Games: 82.18386377457936
Average Number of Reviews for Top 10% of Top Ranking Games: 4149.386580174336
Average Score for Remaining Games: 48.443438506407226
Average Number of Reviews for Remaining Games: 1418.274350832151
Average Score for Unranked Games: 47.79842350083637
Average Number of Reviews for Unranked Games: 183.85307394422676


top_selling_games = updated_df[updated_df['Selling Rank']!='-']

non_top_selling_games = updated_df[updated_df['Selling Rank']== '-']

exclude_genres = ['Graphics', 'Music']

top_genre_counts = top_selling_games['Genres'].explode().value_counts().drop(exclude_genres, errors='ignore')

non_top_genre_counts = non_top_selling_games['Genres'].explode().value_counts().drop(exclude_genres, errors='ignore')

fig, axes = plt.subplots(nrows=2, ncols=1, figsize=(10, 8))

axes[0].bar(top_genre_counts.index, top_genre_counts.values)
axes[0].set_title('Genre Spread in Top Selling Games')
axes[0].set_xlabel('Genres')
axes[0].set_ylabel('Count')
axes[0].tick_params(axis='x', rotation=90)  

axes[1].bar(non_top_genre_counts.index, non_top_genre_counts.values)
axes[1].set_title('Genre Spread in Non-Top Selling Games')
axes[1].set_xlabel('Genres')
axes[1].set_ylabel('Count')
axes[1].tick_params(axis='x', rotation=90) 

plt.tight_layout()

plt.show()


updated_df['Review Score'] = updated_df['Review Score'].str.replace('%', '')
updated_df['Review Score'] = pd.to_numeric(updated_df['Review Score'])

filtered_games = updated_df[updated_df['Review Score'].notnull() & updated_df['Number of Reviews'].notnull()]

exclude_genres = ['Graphics', 'Music']
filtered_games = filtered_games[~filtered_games['Genres'].apply(lambda x: any(genre in exclude_genres for genre in x))]

filtered_games = filtered_games.explode('Genres')

filtered_games['Number of Reviews'] = pd.to_numeric(filtered_games['Number of Reviews'], errors='coerce')

review_numbers = filtered_games.groupby('Genres')['Number of Reviews'].sum()

review_score = filtered_games.groupby('Genres')['Review Score'].mean()

average_score = filtered_games.groupby('Genres')['Review Score'].mean()

fig, ax = plt.subplots(figsize=(12, 8))

x_pos = range(len(review_numbers))

ax.bar(x_pos, review_numbers, color='blue', alpha=0.5, label='Number of Reviews')

ax.axhline(average_score.mean(), color='red', linestyle='--', label='Average Score')

ax.set_xticks(x_pos)
ax.set_xticklabels(review_numbers.index, rotation=45)

ax.set_xlabel('Genres')
ax.set_ylabel('Number of Reviews')
ax.set_title('Spread of Genres with Number of Reviews and Average Score')

for i, genre in enumerate(review_numbers.index):
    avg_score = average_score[genre]
    ax.text(i, review_numbers[genre], f'Avg: {avg_score:.2f}', ha='center', va='bottom')

ax.legend()

plt.tight_layout()
plt.show()


filtered_games = updated_df[updated_df['Selling Rank'].notnull()]

exclude_genres = ['Music', 'Graphics']
filtered_games = filtered_games[~filtered_games['Genres'].apply(lambda x: any(genre in exclude_genres for genre in x))]

filtered_games = filtered_games.explode('Genres')

genre_counts = filtered_games['Genres'].value_counts()

top_seller_counts = filtered_games[filtered_games['Selling Rank'].notnull()]['Genres'].value_counts()

chance_top_seller = (top_seller_counts / len(filtered_games)) * 100

sorted_genres = chance_top_seller.sort_values(ascending=False)

fig, ax = plt.subplots(figsize=(12, 8))

ax.bar(sorted_genres.index, sorted_genres, color='green', alpha=0.7)

plt.xticks(rotation=45)

ax.set_xlabel('Genres')
ax.set_ylabel('Chance of Being in Top Seller (%)')
ax.set_title('Chance of Each Genre (excluding Music and Graphics) to be in Top Seller')

plt.tight_layout()
plt.show()


plt.figure(figsize=(10, 4))
plt.scatter(df['Number of Languages'], df['Number of Reviews'])
plt.xlabel('Number of Languages in each game')
plt.ylabel('Number of Reviews')
plt.title('Relationship between Number of Languages and Number of Reviews')
plt.grid(True)


plt.show()


df['Price'] = df['Price'].astype(str)

df['Price'] = df['Price'].str.replace('₪', '')

df['Price'] = df['Price'].str.lower().replace(['free', 'free to play'], '0')

df['Price'] = pd.to_numeric(df['Price'], errors='coerce')

price_ranges = [0, 50, 100, 150, 200, 300, 500,1000, float('inf')]
price_labels = ['0', '0-50', '50-100', '100-150', '150-200', '200-300', '300-500', '500+']

df['Price Range'] = pd.cut(df['Price'], bins=price_ranges, labels=price_labels, right=False)
price_reviews = df.groupby('Price Range')['Number of Reviews'].sum()

plt.figure(figsize=(10, 6))
price_reviews.plot(kind='bar', color=sns.color_palette('Set3', len(price_labels)))
plt.xlabel('Price Range (₪)')
plt.ylabel('Number of Reviews')
plt.title('Price Range vs Number of Reviews')

plt.show()


plt.figure(figsize=(10, 6))
df.groupby('Release Year')['Number of Reviews'].sum().plot(kind='bar', color='c')
plt.xlabel('Release Year')
plt.ylabel('Number of Reviews')
plt.title('Release Year vs Number of Reviews')
plt.show()

plt.figure(figsize=(10, 6))
sns.boxplot(x=df['Release Season'], y=df['Number of Reviews'], palette='Set3')
plt.xlabel('Release Season')
plt.ylabel('Number of Reviews')
plt.title('Release Season vs Number of Reviews')
plt.show()


df = pd.read_csv('modified_gamedata.csv')

def process_features(df, column):
    df.loc[:, column] = df[column].apply(lambda x: re.sub(r"[^a-zA-Z0-9, ]", "", x))

    df.loc[:, column] = df[column].str.split(', ')

    df_dummy = pd.get_dummies(df[column].apply(pd.Series).stack()).groupby(level=0).sum()
    
    df = pd.concat([df, df_dummy], axis=1)
    df = df.drop([column], axis=1)
    
    return df, df_dummy.columns

for column in ['Genres', 'Num of Players', 'Features', 'Developers', 'Publishers', 'Languages']:
    df, new_features = process_features(df, column)


df = df.fillna(df.mean(numeric_only=True))

threshold = df['Number of Reviews'].quantile(0.75)

df['Success'] = df['Number of Reviews'].apply(lambda x: 1 if x > threshold else 0)

common_features = df[new_features].sum().nlargest(10).index

features = list(common_features) + ['Price','Number of Languages', 'Release Year', 'Release Season']
target = 'Success'

X_train, X_test, y_train, y_test = train_test_split(df[features], df[target], test_size=0.2, random_state=42)

model = RandomForestClassifier(n_estimators=100, random_state=42)

model.fit(X_train, y_train)

predictions = model.predict(X_test)

print('Accuracy:', accuracy_score(y_test, predictions))
print('ROC-AUC:', roc_auc_score(y_test, predictions))

importances = model.feature_importances_
feature_importances = pd.Series(importances, index=features)
feature_importances.nlargest(15).plot(kind='barh')
plt.show()

/var/folders/lx/jbht_9_x1x930wp7dwmw11sm0000gn/T/ipykernel_3732/1024323076.py:33: PerformanceWarning: DataFrame is highly fragmented.  This is usually the result of calling `frame.insert` many times, which has poor performance.  Consider joining all columns at once using pd.concat(axis=1) instead. To get a de-fragmented frame, use `newframe = frame.copy()`
  df['Success'] = df['Number of Reviews'].apply(lambda x: 1 if x > threshold else 0)

Accuracy: 0.8063437373327929
ROC-AUC: 0.7022203232711693

Predicting Video Game Success: A Data Analysis Using Steam Data¶

Introduction:¶

Data Acquisition¶

PROCESSING DATA¶

Exploratory Data Analysis and Visualization¶

MACHINE LEARNING¶

Summary and Conclusions:¶