CoCalc -- 8muses.py

GitHub Repository: mikf/gallery-dl
Path: blob/master/gallery_dl/extractor/8muses.py
⁸⁹³² views
1
# -*- coding: utf-8 -*-
2

3
# Copyright 2019-2025 Mike Fährmann
4
#
5
# This program is free software; you can redistribute it and/or modify
6
# it under the terms of the GNU General Public License version 2 as
7
# published by the Free Software Foundation.
8

9
"""Extractors for https://comics.8muses.com/"""
10

11
from .common import Extractor, Message
12
from .. import text, util
13

14

15
class _8musesAlbumExtractor(Extractor):
16
    """Extractor for image albums on comics.8muses.com"""
17
    category = "8muses"
18
    subcategory = "album"
19
    directory_fmt = ("{category}", "{album[path]}")
20
    filename_fmt = "{page:>03}.{extension}"
21
    archive_fmt = "{hash}"
22
    root = "https://comics.8muses.com"
23
    pattern = (r"(?:https?://)?(?:comics\.|www\.)?8muses\.com"
24
               r"(/comics/album/[^?#]+)(\?[^#]+)?")
25
    example = "https://comics.8muses.com/comics/album/PATH/TITLE"
26

27
    def __init__(self, match):
28
        Extractor.__init__(self, match)
29
        self.path = match[1]
30
        self.params = match[2] or ""
31

32
    def items(self):
33
        url = self.root + self.path + self.params
34

35
        while True:
36
            data = self._unobfuscate(text.extr(
37
                self.request(url).text,
38
                'id="ractive-public" type="text/plain">', '</script>'))
39

40
            if images := data.get("pictures"):
41
                count = len(images)
42
                album = self._make_album(data["album"])
43
                yield Message.Directory, "", {"album": album, "count": count}
44
                for num, image in enumerate(images, 1):
45
                    url = self.root + "/image/fl/" + image["publicUri"]
46
                    img = {
47
                        "url"      : url,
48
                        "page"     : num,
49
                        "hash"     : image["publicUri"],
50
                        "count"    : count,
51
                        "album"    : album,
52
                        "extension": "jpg",
53
                    }
54
                    yield Message.Url, url, img
55

56
            if albums := data.get("albums"):
57
                for album in albums:
58
                    permalink = album.get("permalink")
59
                    if not permalink:
60
                        self.log.debug("Private album")
61
                        continue
62

63
                    url = self.root + "/comics/album/" + permalink
64
                    yield Message.Queue, url, {
65
                        "url"       : url,
66
                        "name"      : album["name"],
67
                        "private"   : album["isPrivate"],
68
                        "_extractor": _8musesAlbumExtractor,
69
                    }
70

71
            if data["page"] >= data["pages"]:
72
                return
73
            path, _, num = self.path.rstrip("/").rpartition("/")
74
            path = path if num.isdecimal() else self.path
75
            url = f"{self.root}{path}/{data['page'] + 1}{self.params}"
76

77
    def _make_album(self, album):
78
        return {
79
            "id"     : album["id"],
80
            "path"   : album["path"],
81
            "parts"  : album["path"].split("/"),
82
            "title"  : album["name"],
83
            "private": album["isPrivate"],
84
            "url"    : self.root + "/comics/album/" + album["permalink"],
85
            "parent" : text.parse_int(album["parentId"]),
86
            "views"  : text.parse_int(album["numberViews"]),
87
            "likes"  : text.parse_int(album["numberLikes"]),
88
            "date"   : self.parse_datetime_iso(album["updatedAt"]),
89
        }
90

91
    def _unobfuscate(self, data):
92
        return util.json_loads("".join([
93
            chr(33 + (ord(c) + 14) % 94) if "!" <= c <= "~" else c
94
            for c in text.unescape(data.strip("\t\n\r !"))
95
        ]))
96

97
Product

Resources

Company