initial commit

2020-01-25 11:40:20 +00:00 · 2020-01-25 11:40:20 +00:00 · db436a3488
commit db436a3488
6 changed files with 125 additions and 0 deletions
--- a/.gitignore
+++ b/.gitignore
@ -0,0 +1,6 @@
+venv
+__pycache__
+*.csv
+.idea
+.fm
+scratch.py
--- a/README.md
+++ b/README.md
@ -0,0 +1,4 @@
+listening analysis
+==================
+
+performing analysis on listening habits using last.fm and spotify data
--- a/log.py
+++ b/log.py
@ -0,0 +1,22 @@
+import logging
+
+logger = logging.getLogger('listening')
+spotframework_logger = logging.getLogger('spotframework')
+fmframework_logger = logging.getLogger('fmframework')
+spotfm_logger = logging.getLogger('spotfm')
+
+logger.setLevel('DEBUG')
+spotframework_logger.setLevel('INFO')
+fmframework_logger.setLevel('INFO')
+spotfm_logger.setLevel('INFO')
+
+log_format = '%(levelname)s %(name)s:%(funcName)s - %(message)s'
+formatter = logging.Formatter(log_format)
+
+stream_handler = logging.StreamHandler()
+stream_handler.setFormatter(formatter)
+
+logger.addHandler(stream_handler)
+spotframework_logger.addHandler(stream_handler)
+fmframework_logger.addHandler(stream_handler)
+spotfm_logger.addHandler(stream_handler)
--- a/requirements.txt
+++ b/requirements.txt
@ -0,0 +1,9 @@
+certifi==2019.11.28
+chardet==3.0.4
+Click==7.0
+idna==2.8
+numpy==1.18.1
+opencv-python==4.1.2.30
+requests==2.22.0
+tabulate==0.8.6
+urllib3==1.25.7
--- a/scrobble-prep.py
+++ b/scrobble-prep.py
@ -0,0 +1,83 @@
+from fmframework.net.network import Network as FmNet
+
+from spotframework.net.network import Network as SpotNet
+from spotframework.net.user import NetworkUser
+from spotframework.model.uri import Uri
+
+from csv import DictWriter
+
+import os
+import datetime
+import json
+from log import logger
+
+spotnet = SpotNet(NetworkUser(client_id=os.environ['SPOT_CLIENT'],
+                              client_secret=os.environ['SPOT_SECRET'],
+                              refresh_token=os.environ['SPOT_REFRESH']).refresh_access_token())
+fmnet = FmNet(username='sarsoo', api_key=os.environ['FM_CLIENT'])
+
+# initialise cache
+uri_cache_name = 'uris.json'
+if os.path.isfile(uri_cache_name):
+    with open(uri_cache_name, 'r') as uri_cache:
+        uris = json.loads(uri_cache.read())
+else:
+    uris = []
+
+# scrobble range
+from_date = datetime.datetime(year=2017, month=1, day=1)
+to_date = datetime.datetime(year=2018, month=1, day=1)
+
+scrobbles = fmnet.get_recent_tracks(from_time=from_date, to_time=to_date, page_limit=200)
+
+# populate with uris
+for scrobble in scrobbles:
+
+    cache_entry = [i for i in uris if
+                   i['name'] == scrobble.track.name.lower() and
+                   i['artist'] == scrobble.track.artist.name.lower()]
+
+    # check cache
+    if len(cache_entry) == 0:
+        logger.info(f'pulling {scrobble.track}')
+        spotify_search = spotnet.search(query_types=[Uri.ObjectType.track],
+                                        track=scrobble.track.name,
+                                        artist=scrobble.track.artist.name,
+                                        response_limit=5).tracks
+        if len(spotify_search) > 0:
+            uris.append({
+                'name': scrobble.track.name.lower(),
+                'artist': scrobble.track.artist.name.lower(),
+                'uri': str(spotify_search[0].uri)
+            })
+            scrobble.uri = spotify_search[0].uri
+        else:
+            logger.debug('no search tracks returned')
+            scrobble.uri = None
+
+    # cache entry available
+    else:
+        # logger.info(f'{scrobble.track} found in cache')
+        scrobble.uri = cache_entry[0]['uri']
+
+date = str(datetime.date.today())
+with open(f'{date}_scrobbles.csv', 'w', newline='') as fileobj:
+
+    headers = ['track', 'album', 'artist', 'time', 'track id', 'album id', 'artist id', 'uri']
+    writer = DictWriter(fileobj, fieldnames=headers, dialect='excel-tab')
+    writer.writeheader()
+
+    for scrobble in scrobbles:
+        writer.writerow({
+            'track': scrobble.track.name,
+            'album': scrobble.track.album.name,
+            'artist': scrobble.track.artist.name,
+            'time': scrobble.time,
+            'track id': scrobble.track.mbid,
+            'album id': scrobble.track.album.mbid,
+            'artist id': scrobble.track.artist.mbid,
+            'uri': str(scrobble.uri) if scrobble.uri is not None else ''
+        })
+
+with open(uri_cache_name, 'w') as uri_cache:
+    uri_cache.write(json.dumps(uris))
--- a/uris.json
+++ b/uris.json