Benutzer-Werkzeuge

Webseiten-Werkzeuge


Übersetzungen dieser Seite?:
de:implementation_cscd

namo tassa bhagavato arahato sammasambuddhassa

Einarbeitungen des CS-Tipitaka

Einleitung

Diskussionen und Bezüge siehe auch

Die Originalfiles wurden von Upasaka Moritz von uft-16 auf utf-8 konvertiert, und in diesem Zustand im Upload CSCD Tipitaka XML files: Charset various scripts UTF-8 abgelegt, von dort weiter verarbeitet in txt-Files umbenannt, entsprechend der Codeliste, in das Format der Wiki-Umgebung, im Konvertieren von xml ins ATI.eu-Format eingearbeitet.

Kodierung der Files

Die Files und Ordner sind an das, mit dem Khmer-Tipitaka zu entwickeln begonnene Codesystem, ausgerichtet. Nun zur selben Zeit ist versucht die Struktur von ATI einzubauen, bzw. anzugleichen.

Um einen Überblick über die Maßgeblichen Verzeichnisse zu gewinnen, siehe Seitenübersicht und Ordner „cs-rm“.

cs“ steht für die Tipitaka-Ausgabe, „Chaṭṭha Saṅgāyana, großzügig an die Sangha der acht Richtungen, via sangham.net, vom kurz danach verstorbenen Sir Goenka,Vipassana Lehrer, und seinem Vippassana Research Institut, hier gegeben.

rm“ steht für „roman“ und dieser, dem Bindestrich folgende Code, beschreibt die jeweilige Schrift. Hier, zu Beginn, romanischen/latein.

Sprach/Schrift-Verzeichnisse

cs-{lang}, wenn möglich nach List of ISO 639-1 codes, bzw. dem Ländercode des Landes in dem die Schrift verwendet wird.

Code Schrift angelegt? Fortschritt Priorität
cs-rm romanisch/latein ja Ordner angelegt, Verzeichnisse angelegt, in Arbeit 1
cs-km Khmer nein uft-8 convertiert 1
cs-th Thai nein uft-8 convertiert 2
cs-ru Cyrill/(russisch) nein uft-8 convertiert 2
cs-si Sinhala nein - 2
cs-my Burmesisch/Myanmar nein - 3
? Gurmukhi nein - 4
? Tibetan nein - 4
? Bengali nein - 2
? Gujarati nein - 4
? Malayalam nein - 4
? Devanagari nein - 3
? Tamil nein - 3
? Telugu nein - 4
? Kannada nein - 4

Struktur Ordner und File-Namen

Die Ordner hier wurden mit Namensräumen passend zu den Tipitaka-Codes und der CSCD-Struktur angelegt. (siehe vorerst Seitenübersicht)

Zum Beispiel cs-rm:

Tipiṭaka (Mūla)

Gesamtverzeichnis: cs-rm:tipitaka

Übersicht (hier alphabetisch geordnet):

index_tipitaka.jpg

Kn:

index_sutta.jpg

  • Tipitaka (index) {cs-rm:tipitaka}
    • Vinaya (index) {cs-rm:tipitaka:vin}
    • Sutta {cs-rm:tipitaka:sut}
      • Diganikaya (index) {cs-rm:tipitaka:sut:dn:dn}
        • Sīlakkhandhavaggau (table-file) {cs-rm:tipitaka:sut:dn:sut.dn.v1} Filename: sut.dn.v1
        • 1. Brahmajālasuttaṃ (sutta-file) {cs-rm:tipitaka:sut:dn:sut.dn.01} Filemane: sut.dn.01
    • Abhidhamma {cs-rm:tipitaka:abh}

Datenfiles und Sutta- und Abschnittsanker:

{Pitaka}.{Nikaya}.({Vagga}.).{Nr. des Vaggas/Sutta}.txt
sut.dn.01#dn01.01 - sut.dn.34#dn34…
sut.mn.001-010#mn001 - sut.mn.143-152#mn152.01
sut.sn01#sn01.001 - sut.sn56#sn56…
sut.an01.v01#an01.001 - sut.an11.v11#an11…
sut.kn.dhp01#dhp001 - sut.kn.dhp#dhp…

Die Ebene von Vaggas, wie z.b. in dn oder mn, würden ausgelassen, um sich an die ATI-Struktur und westlich üblichen Gebrauch zu halten und eher flache Struktur zu schaffen.

Derzeitige vorrangige Arbeit, um nicht ein Code-Chaos zu erwirken, ist daher der Einbau der Verzeichnisse, Index und Vagga-Index-Seiten, welche dann guten Aufschluß über Folgebezeichnung geben. Der Ordner Tipitaka ist jedoch bereits fertig.

Die tiefst liegenden Verzeichnisse sind immer in “index.txt„ gegeben und reichen für gewöhnlich bis zu Ebene von Nikayas (und sinngemäß).

Vagga-Verzeichnisse werden mit {pitaka}.{nikaya}.{Vagga}.txt bezeichnet, wie zb. sut.mn.p1.txt.

Mit der Namensgebung sollte im Sprachbereich „cs-rm“ das richtige File mit bloßem Filename gefunden werden:

[[sut.mn.001-010]]

Ein einzelnes Sutta kann dann mit Beifügung des Ankers erreicht werden:

[[sut.mn.001-010#mn010]]

Offene Frage: Wie eventuell ein sutta mit etwa mn001

[[mn001]]

erreicht werden könnte…? Sollte nun noch nicht zu viele Gedanken aufbrauchen, und wenn Struktur fest, sicher mit etwas wie java erreichbar.

Aṭṭhakathā

Atthakatha hat im groben selbe Struktur wie Tipitaka. Files, so sie nicht mit Files und Verzeichnissen des Tipitaka korrespondieren, haben neue Bezeichnungen. Sonst witd die Endung von _att hinzugefügt, z.B: sut.dn.v1_att für Verzeichnisse, oder sut.dn.01_att für Datenfiles.

Tīkā

tika sinngemäß wie Atthakatha.

Endung von _tik hinzugefügt, z.B: sut.dn.v1_tik

Anya

anya ist als Sammlung verschiedenen Umfangs und verschiedener Autoren in reinen Namensseiten vergeben, die Sonderzeichen in gewöhnliche gewandelt.

Konvertierung xml in ati.eu

Die vom Vipassana-Research Institute dargebotenen Files werden gemäß dem Standard oben umbenannt, in uft-8 Format konvertiert und für die Anpassung hier vom einem xlm-Code in einen wiki-html Code, an das Plugin Wrap angepaßt, umgewandelt.

Folgene Regeln wurden begonnen:

Kopf- und Fußbereich

Kopfbereich

<?xml version="1.0" encoding="UTF-16"?>
<?xml-stylesheet type="text/xsl" href="tipitaka-latn.xsl"?>
<TEI.2>
<teiHeader></teiHeader>
<text>
<front></front>
<body>

wird gelöscht.

Fußbereich

</body>
<back></back>
</text>
</TEI.2>

wird ebenfalls gelöscht, und mit einer Datentabele ersetzt (siehe Unterredung [ATI.eu] Page datas, Infos, "Licence": dokuwiki

Entwurf:

---- dataentry cs-tipitaka ----
title            : 1. Mūlapariyāyavaggo
subject          : Tipitaka (Mula) roman script (cs-rm:tipitaka)
filename         : sut.mn.v01
url              : http://accesstoinsight.eu/doku.php?id=cs-rm:tipitaka:sut:mn:sut.mn.v01
donator          : Vipassana Research institute
orig_source_file : s0201m.mul0.xml
orig_source_url  : http://tipitaka.org/romn/cscd/
date_donation    : 02 May 2013 (http://sangham.net/index.php/topic,541.msg1491.html#msg1491)
dedication       : Sanghika Dana
mainedit         : mr, utf-8 converting; ...
notes            : what ever...
----

Ersetzen von Codes und Anker

folgene Ersetzregeln wurden angedacht:

centre

<p rend="centre">{text Namo tassa bhagavato arahato sammāsambuddhassa}

ersetzen mit: div wrap_centre

<div wrap_centre> Namo tassa bhagavato arahato sammāsambuddhassa

nikaya

<p rend="nikaya">{Name}

ersetzen mit: Überschrift 1 Ebene, Anker hinzufügen

====== Name ======
<span wrap_suttaid #sut.mn>sut.mn</span>

sut.mn ist der Ankertext, id, und wird vielleicht nicht automatisiert werden können.

book

<p rend="book">{Name}

ersetzen mit: Überschrift 1 Ebene, Anker hinzufügen

====== Name ======
<span wrap_suttaid #sut.mn.p1>sut.mn.p1</span>

sut.mn.p1 ist der Ankertext, id, und wird vielleicht nicht automatisiert werden können.

chapter

Entspricht meist dem Filenamen.

<p rend="chapter">{Name}

ersetzen mit: Überschrift 2 Ebene, Anker hinzufügen

===== Name =====
<span wrap_suttaid #sut.mn.v01>sut.mn.v01</span>

sut.mn.v01 ist der Ankertext, id, und mag vielleicht mit Filename automatisiert werden

subhead

Entspricht meist dem einzelnen Sutta, bzw. Sub-Vagga. Manchmal fehlt diese Überschrift.

Wenn fehlend (vor p-tag mit Anker) ev. mit Name = Ankertext einfügen.

<p rend="subhead">{Name}

ersetzen mit: Überschrift 3 Ebene, Anker hinzufügen

==== Name ====
<span wrap_suttaid #sut.mn.001>sut.mn.001</span>

sut.mn.001 ist der Ankertext, id, und mag vielleicht dann etwas automatisiert werden, wenn sich Gruppe nicht über mehrere Files zieht.

bodytext mit Sutta-Anker

Entspricht dem jeweiligen einzelnen Sutta.

<p rend="bodytext" n="1">{text}

ersetzen mit:

<span wrap_bodytext #s001>{text}</span>

s001 steht für Sutta Nr., Mag abhängig von paranum (oder subhead-id) errungen werden. Hier wieder: nicht leicht automatisierbar wenn Gruppe über mehrere Files geht.

paranum

Steht für das Syling der Paragraphnummer

<hi rend="paranum">{nr}</hi><hi rend="dot">.</hi>

ersetzen mit:

<span wrap_paranum>{nr}.</span>

Der span dot kann sicher wegfallen.

Diverse Anker

Anker, enthalten im File, wahrscheinlich Verweise auf physische Bücher, mögen so sinngemäß ersetzt werde:

<pb ed="M" n="1.0001" />

ersetzen mit:

<span wrap_divanchor #M_1.0001></span>

ed und n mit Unterstrich zusammengefaßt.

note

Entspricht Bemerkungen über andere Textausführung in anderer Länder Ausgaben.

<note>{text}</note>

ersetzen mit dem wiki-code:

(({text}))

gatha

Wird für gewisse Textteile, Versform, verwendet, und reich von gatha zu gatha1 usw. (sinngemäß)

<p rend="gatha">{text}

gatha1 usw. ersetzen mit

<span wrap_gatha>{text}</span>

Aufkommende zuzätzliche Code-tags sinngemäß.

Sonsige Einarbeitungen

in Folge

  • Überschriften des nächsten Files sind oft am Ende des vorhergehenden. Im Folgefile, wenn passend, ergänzen.
  • Referenzanker zu Khmer-Ausgabe, PTS…

Diskussion

Eröffnung

Anliegen, Abänderungen, … bitte hier zufügen.
Mögen sich alle Wesen mit den aufkommenden Verdiensten hier miterfreuen. Anumodana!Johann 2018/07/01 17:06

Neue Klasse <WRAP fill> für Boxen mit 100% verfügbarer Breite, auch neben Inhaltsverzeichnis

Habe Änderungen an der „Namo…“-Box in Inhaltsverzeichnissen vorgenommen, damit sie (auf PC-Bildschirm) nicht unter dem lang-gestreckten seitlichen Inhaltsverzeichnis sondern platzfüllend daneben erscheint.
Dazu eine neue Klasse „wrap_fill“ für das Wrap-Plugin definiert, also in Wiki-Syntax zu verwenden als etwa “<WRAP fill>„, “<WRAP box fill>„ etc.
Achtung: Nicht zu verwenden in Kombination mit einer Breitenangabe, wie etwa “<WRAP box fill 100% >„. Die Breite wird automatisch füllend gesetzt und sollte nicht im Code vorgegeben werden. Sonst funktioniert es nicht.

Sollte auch für alle anderen Abschnitte/Boxen passen, die 100% verfügbare Breite (also eventuell auch neben dem Inhaltsverzeichnis) haben sollen. — Moritz 2018/0712/20:32

de/implementation_cscd.txt · Zuletzt geändert: 2019/08/13 08:37 von Johann