Path: blob/master/node_modules/@protobufjs/utf8/tests/data/utf8.txt
1129 views
UTF-8 encoded sample plain-text file1‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾23Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25 CC BY456The ASCII compatible UTF-8 encoding used in this plain-text file7is defined in Unicode, ISO 10646-1, and RFC 2279.8910Using Unicode/UTF-8, you can write in emails and source code things such as1112Mathematics and sciences:1314∮ E⋅da = Q, n → ∞, ∑ f(i) = ∏ g(i), ⎧⎡⎛┌─────┐⎞⎤⎫15⎪⎢⎜│a²+b³ ⎟⎥⎪16∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β), ⎪⎢⎜│───── ⎟⎥⎪17⎪⎢⎜⎷ c₈ ⎟⎥⎪18ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ, ⎨⎢⎜ ⎟⎥⎬19⎪⎢⎜ ∞ ⎟⎥⎪20⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫), ⎪⎢⎜ ⎲ ⎟⎥⎪21⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪222H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm ⎩⎣⎝i=1 ⎠⎦⎭2324Linguistics and dictionaries:2526ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn27Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ]2829APL:3031((V⍳V)=⍳⍴V)/V←,V ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈3233Nicer typography in plain text files:3435╔══════════════════════════════════════════╗36║ ║37║ • ‘single’ and “double” quotes ║38║ ║39║ • Curly apostrophes: “We’ve been here” ║40║ ║41║ • Latin-1 apostrophe and accents: '´` ║42║ ║43║ • ‚deutsche‘ „Anführungszeichen“ ║44║ ║45║ • †, ‡, ‰, •, 3–4, —, −5/+5, ™, … ║46║ ║47║ • ASCII safety test: 1lI|, 0OD, 8B ║48║ ╭─────────╮ ║49║ • the euro symbol: │ 14.95 € │ ║50║ ╰─────────╯ ║51╚══════════════════════════════════════════╝5253Combining characters:5455STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑5657Greek (in Polytonic):5859The Greek anthem:6061Σὲ γνωρίζω ἀπὸ τὴν κόψη62τοῦ σπαθιοῦ τὴν τρομερή,63σὲ γνωρίζω ἀπὸ τὴν ὄψη64ποὺ μὲ βία μετράει τὴ γῆ.6566᾿Απ᾿ τὰ κόκκαλα βγαλμένη67τῶν ῾Ελλήνων τὰ ἱερά68καὶ σὰν πρῶτα ἀνδρειωμένη69χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!7071From a speech of Demosthenes in the 4th century BC:7273Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,74ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς75λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ76τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿77εἰς τοῦτο προήκοντα, ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ78πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν79οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,80οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν81ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον82τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι83γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν84προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους85σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ86τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ87τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς88τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.8990Δημοσθένους, Γ´ ᾿Ολυνθιακὸς9192Georgian:9394From a Unicode conference invitation:9596გთხოვთ ახლავე გაიაროთ რეგისტრაცია Unicode-ის მეათე საერთაშორისო97კონფერენციაზე დასასწრებად, რომელიც გაიმართება 10-12 მარტს,98ქ. მაინცში, გერმანიაში. კონფერენცია შეჰკრებს ერთად მსოფლიოს99ექსპერტებს ისეთ დარგებში როგორიცაა ინტერნეტი და Unicode-ი,100ინტერნაციონალიზაცია და ლოკალიზაცია, Unicode-ის გამოყენება101ოპერაციულ სისტემებსა, და გამოყენებით პროგრამებში, შრიფტებში,102ტექსტების დამუშავებასა და მრავალენოვან კომპიუტერულ სისტემებში.103104Russian:105106From a Unicode conference invitation:107108Зарегистрируйтесь сейчас на Десятую Международную Конференцию по109Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.110Конференция соберет широкий круг экспертов по вопросам глобального111Интернета и Unicode, локализации и интернационализации, воплощению и112применению Unicode в различных операционных системах и программных113приложениях, шрифтах, верстке и многоязычных компьютерных системах.114115Thai (UCS Level 2):116117Excerpt from a poetry on The Romance of The Three Kingdoms (a Chinese118classic 'San Gua'):119120[----------------------------|------------------------]121๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช พระปกเกศกองบู๊กู้ขึ้นใหม่122สิบสองกษัตริย์ก่อนหน้าแลถัดไป สององค์ไซร้โง่เขลาเบาปัญญา123ทรงนับถือขันทีเป็นที่พึ่ง บ้านเมืองจึงวิปริตเป็นนักหนา124โฮจิ๋นเรียกทัพทั่วหัวเมืองมา หมายจะฆ่ามดชั่วตัวสำคัญ125เหมือนขับไสไล่เสือจากเคหา รับหมาป่าเข้ามาเลยอาสัญ126ฝ่ายอ้องอุ้นยุแยกให้แตกกัน ใช้สาวนั้นเป็นชนวนชื่นชวนใจ127พลันลิฉุยกุยกีกลับก่อเหตุ ช่างอาเพศจริงหนาฟ้าร้องไห้128ต้องรบราฆ่าฟันจนบรรลัย ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ129130(The above is a two-column text. If combining characters are handled131correctly, the lines of the second column should be aligned with the132| character above.)133134Ethiopian:135136Proverbs in the Amharic language:137138ሰማይ አይታረስ ንጉሥ አይከሰስ።139ብላ ካለኝ እንደአባቴ በቆመጠኝ።140ጌጥ ያለቤቱ ቁምጥና ነው።141ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።142የአፍ ወለምታ በቅቤ አይታሽም።143አይጥ በበላ ዳዋ ተመታ።144ሲተረጉሙ ይደረግሙ።145ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።146ድር ቢያብር አንበሳ ያስር።147ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።148እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።149የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።150ሥራ ከመፍታት ልጄን ላፋታት።151ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።152የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።153ተንጋሎ ቢተፉ ተመልሶ ባፉ።154ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።155እግርህን በፍራሽህ ልክ ዘርጋ።156157Runes:158159ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ160161(Old English, which transcribed into Latin reads 'He cwaeth that he162bude thaem lande northweardum with tha Westsae.' and means 'He said163that he lived in the northern land near the Western Sea.')164165Braille:166167⡌⠁⠧⠑ ⠼⠁⠒ ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌168169⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞170⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎171⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂172⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙173⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑174⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲175176⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲177178⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹179⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞180⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕181⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹182⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎183⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎184⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳185⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞186⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲187188(The first couple of paragraphs of "A Christmas Carol" by Dickens)189190Compact font selection example text:191192ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789193abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ194–—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд195∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა196197Greetings in various languages:198199Hello world, Καλημέρα κόσμε, コンニチハ200201Box drawing alignment tests: █202▉203╔══╦══╗ ┌──┬──┐ ╭──┬──╮ ╭──┬──╮ ┏━━┳━━┓ ┎┒┏┑ ╷ ╻ ┏┯┓ ┌┰┐ ▊ ╱╲╱╲╳╳╳204║┌─╨─┐║ │╔═╧═╗│ │╒═╪═╕│ │╓─╁─╖│ ┃┌─╂─┐┃ ┗╃╄┙ ╶┼╴╺╋╸┠┼┨ ┝╋┥ ▋ ╲╱╲╱╳╳╳205║│╲ ╱│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╿ │┃ ┍╅╆┓ ╵ ╹ ┗┷┛ └┸┘ ▌ ╱╲╱╲╳╳╳206╠╡ ╳ ╞╣ ├╢ ╟┤ ├┼─┼─┼┤ ├╫─╂─╫┤ ┣┿╾┼╼┿┫ ┕┛┖┚ ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳207║│╱ ╲│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╽ │┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▎208║└─╥─┘║ │╚═╤═╝│ │╘═╪═╛│ │╙─╀─╜│ ┃└─╂─┘┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▏209╚══╩══╝ └──┴──┘ ╰──┴──╯ ╰──┴──╯ ┗━━┻━━┛ ▗▄▖▛▀▜ └╌╌┘ ╎ ┗╍╍┛ ┋ ▁▂▃▄▅▆▇█210▝▀▘▙▄▟211212Surrogates:213214𠜎 𠜱 𠝹 𠱓 𠱸 𠲖 𠳏 𠳕 𠴕 𠵼 𠵿 𠸎 𠸏 𠹷 𠺝 𠺢 𠻗 𠻹 𠻺 𠼭 𠼮 𠽌 𠾴 𠾼 𠿪 𡁜 𡁯 𡁵 𡁶 𡁻 𡃁215𡃉 𡇙 𢃇 𢞵 𢫕 𢭃 𢯊 𢱑 𢱕 𢳂 𢴈 𢵌 𢵧 𢺳 𣲷 𤓓 𤶸 𤷪 𥄫 𦉘 𦟌 𦧲 𦧺 𧨾 𨅝 𨈇 𨋢 𨳊 𨳍 𨳒 𩶘216217218