use enum for time range, added scrobble count to returned tracks

2020-08-11 18:28:37 +01:00 · 2020-08-11 18:28:37 +01:00 · cc67a08402
commit cc67a08402
parent ebe2fc94bf
1 changed files with 37 additions and 9 deletions
--- a/fmframework/net/scrape.py
+++ b/fmframework/net/scrape.py
@ -1,4 +1,5 @@
 from datetime import date, datetime
 from typing import Union
 from bs4 import BeautifulSoup
 from requests import Session
@ -11,9 +12,27 @@ import logging
 logger = logging.getLogger(__name__)
 class LibraryScraper:
    rsession = Session()
    @staticmethod
    def api_date_range_to_url_string(period: Network.Range):
        if period == Network.Range.WEEK:
            return 'LAST_7_DAYS'
        elif period == Network.Range.MONTH:
            return 'LAST_30_DAYS'
        elif period == Network.Range.QUARTER:
            return 'LAST_90_DAYS'
        elif period == Network.Range.HALFYEAR:
            return 'LAST_180_DAYS'
        elif period == Network.Range.YEAR:
            return 'LAST_365_DAYS'
        elif period == Network.Range.OVERALL:
            return 'ALL'
        else:
            raise TypeError(f'invalid period provided, {period} / {type(period)}')
    @staticmethod
    def get_scrobbled_tracks(username: str, artist: str, net: Network = None, whole_track=True,
                             from_date: datetime = None, to_date: datetime = None,
@ -79,7 +98,6 @@ class LibraryScraper:
        else:
            logger.error(f'no tracks returned for page 1 of {artist} / {username}')
    @staticmethod
    def get_scrobbled_albums(username: str, artist: str, net: Network = None, whole_album=True,
                             from_date: datetime = None, to_date: datetime = None,
@ -292,7 +310,6 @@ class LibraryScraper:
                    scrobble_datetime = None
                    logger.error(f'{len(timestamp_parts)} timestamp parts found, {timestamp_parts}')
                track_objects.append(Scrobble(track=Track(name=name_cell.string,
                                                          artist=Artist(name=artist),
                                                          album=Album(name=album_cell.string,
@ -301,6 +318,10 @@ class LibraryScraper:
                                              time=scrobble_datetime)
                                     )
            length = len(track_objects)
            for scrobble in track_objects:
                scrobble.track.user_scrobbles = length
            return track_objects
        else:
            logger.error(f'no scrobbles returned for page 1 of {track} / {artist} / {username}')
@ -314,7 +335,7 @@ class LibraryScraper:
                                   include_pages=False,
                                   from_date: datetime = None, to_date: datetime = None,
-                                   date_preset: str = None):
+                                   date_preset: Union[str, Network.Range] = None):
        logger.debug(f'loading page {page} of {artist} for {username}')
        url = f'https://www.last.fm/user/{username}/library/music/{parse.quote_plus(artist)}'
@ -332,13 +353,19 @@ class LibraryScraper:
        if from_date and to_date:
            url += f'&from={from_date.strftime("%Y-%m-%d")}&to={to_date.strftime("%Y-%m-%d")}'
        elif date_preset:
            if isinstance(date_preset, str):
                date_preset = date_preset.strip().upper()
                if date_preset not in ['LAST_7_DAYS', 'LAST_30_DAYS', 'LAST_90_DAYS',
                                       'LAST_180_DAYS', 'LAST_365_DAYS', 'ALL']:
                    raise ValueError(f'date range {date_preset} not of allowed value')
                url += f'&date_preset={date_preset}'
            elif isinstance(date_preset, Network.Range):
                url += f'&date_preset={LibraryScraper.api_date_range_to_url_string(date_preset)}'
            else:
                raise TypeError(f'invalid period provided, {date_preset} / {type(date_preset)}')
        html = LibraryScraper.rsession.get(url)
        if 200 <= html.status_code < 300:
@ -350,7 +377,7 @@ class LibraryScraper:
                objs = [i for i in list_section.tbody.find_all('tr') if i.find('td', class_='chartlist-name')]
                if include_pages:
-                    return (objs, len(parser.find_all('li', class_='pagination-page')))
+                    return objs, len(parser.find_all('li', class_='pagination-page'))
                else:
                    return objs
            else:
@ -359,6 +386,7 @@ class LibraryScraper:
        else:
            logger.error(f'HTTP error occurred {html.status_code}')
 class UserScraper:
    rsession = Session()