-
Notifications
You must be signed in to change notification settings - Fork 0
/
node4.html
executable file
·178 lines (160 loc) · 8.03 KB
/
node4.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//FI">
<!--Converted with jLaTeX2HTML 2002 (1.62) JA patch-1.4
patched version by: Kenshi Muto, Debian Project.
LaTeX2HTML 2002 (1.62),
original version by: Nikos Drakos, CBLU, University of Leeds
* revised and updated by: Marcus Hennecke, Ross Moore, Herb Swan
* with significant contributions from:
Jens Lippmann, Marek Rouchal, Martin Wilck and others -->
<HTML>
<HEAD>
<TITLE>1.1 Miksi puhetta nimikoidaan eli
annotoidaan?</TITLE>
<META NAME="description" CONTENT="1.1 Miksi puhetta nimikoidaan eli
annotoidaan?">
<META NAME="keywords" CONTENT="annotation_guide">
<META NAME="resource-type" CONTENT="document">
<META NAME="distribution" CONTENT="global">
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8">
<META NAME="Generator" CONTENT="jLaTeX2HTML v2002 JA patch-1.4">
<META HTTP-EQUIV="Content-Style-Type" CONTENT="text/css">
<LINK REL="STYLESHEET" HREF="annotation_guide.css">
<LINK REL="next" HREF="node5.html">
<LINK REL="previous" HREF="node3.html">
<LINK REL="up" HREF="node3.html">
<LINK REL="next" HREF="node5.html">
</HEAD>
<BODY >
<!--Navigation Panel-->
<A NAME="tex2html462"
HREF="node5.html">
<IMG WIDTH="37" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="next" SRC="next.png"></A>
<A NAME="tex2html456"
HREF="node3.html">
<IMG WIDTH="26" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="up" SRC="up.png"></A>
<A NAME="tex2html450"
HREF="node3.html">
<IMG WIDTH="63" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="previous" SRC="prev.png"></A>
<A NAME="tex2html458"
HREF="node1.html">
<IMG WIDTH="65" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="contents" SRC="contents.png"></A>
<A NAME="tex2html460"
HREF="node63.html">
<IMG WIDTH="43" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="index" SRC="index.png"></A>
<BR>
<!--End of Navigation Panel-->
<!--Table of Child-Links-->
<A NAME="CHILD_LINKS"><STRONG>Aliluvut</STRONG></A>
<UL>
<LI><A NAME="tex2html464"
HREF="node4.html#SECTION02111000000000000000">1.1.1 Johdonmukainen annotaatio</A>
</UL>
<!--End of Table of Child-Links-->
<HR>
<H1><A NAME="SECTION02110000000000000000"></A><A NAME="sec:Miksi-puhetta-nimikoidaan"></A>
<BR>
1.1 Miksi puhetta nimikoidaan eli
annotoidaan?
</H1>
<P>
Nimikointityökalua käyttämällä puhenäytteestä on helppo nopeasti ja
tarkasti etsiä, rajata ja kuunnella eri pituisia osia. Tämä helpottaa,
nopeuttaa ja tarkentaa merkittävästi litterointia ja transkriptiota.
Esimerkiksi intonaatiotranskription tekeminen helpottuu, kun kuulohavaintoa
voidaan heti verrata äänisignaalista laskettuun perustaajuuskäyrään.
<P>
Nimikoidusta äänitiedostosta voidaan mitata tarkasti puheen eri yksiköiden
kestoja. Mittauksia voidaan suorittaa jopa täysin automaattisesti
(edellyttäen että puhe on nimikoitu mittausten kannalta järkeviin
yksiköihin). Erilaiset akustiset analyysit voidaan automaattisesti
kohdistaa vain tarvittaviin osiin näytettä. Nimikoinnin perusteella
tehdyt mittaukset voidaan milloin tahansa toistaa täysin identtisinä.
Tutkimustuloksiin on siten helppo myöhemmin palata.
<P>
Digitaalinen ääninäyte säilyy tarvittaessa täysin muuttumattomana
pitkiäkin aikoja ja siitä voidaan tehdä identtisiä kopioita. Alkuperäistä
digitoitua ääninäytettä (esim. keskusteluäänite) ei tarvitse välttämättä
pilkkoa pienempiin osiin jokaista tutkimusta tai demoa varten, vaan
se voidaan säilyttää kokonaisena esimerkiksi CD- tai DVD-levyillä,
eikä tällöin menetetä informaatiota esimerkiksi taukojen kestoista.
<P>
Digitaalista, systemaattisesti nimikoitua puheaineistoa on helppo
jakaa muidenkin tutkijoiden kanssa. Muut tutkijat voivat nopeasti
tutustua nimikoituun puhenäytteeseen ja käyttää sitä soveltuvin osin.
Nimikointeihin voidaan tehdä muutoksia ja lisäyksiä oman tarpeen mukaan.
Tämän oppaan periaatteiden mukaisesti nimikoitu äänitiedosto voidaan
liittää osaksi kaikkien tutkijoiden käyttämää puhetietokantaa, eikä
tutkijoiden tarvitse aina itse kerätä ja nimikoida uusia aineistoja.
<P>
Annotaation tekeminen on usein pitkäveteistä puurtamista. Jokaisen
puheentutkijan olisi kuitenkin hyödyllistä yrittää annotoida itse
ainakin koemielessä pieni osa käyttämästään aineistosta, sillä näin
oppii ymmärtämään annotaatioprosessia ja sen vaikutuksia tutkimukseen.
Usein annotoidessa löytää myös mielenkiintoisia uusia tutkimuskohteita.
<P>
<H2><A NAME="SECTION02111000000000000000"></A><A NAME="sub:Johdonmukainen-annotaatio"></A>
<BR>
1.1.1 Johdonmukainen annotaatio
</H2>
<P>
Puheen kuvauksessa tulee pyrkiä noudattamaan yhtenäisiä periaatteita,
jotta aineiston annotaatio pysyisi kauttaaltaan mahdollisimman tasalaatuisena
ja jotta se olisi kenen tahansa tutkijan käytettävissä ja ymmärrettävissä.
Annotoijalle pitää olla aina täysin selvää, mitä ilmiötä, yksikköä
tai käsitettä ollaan annotoimassa, ja tietyntyyppiset yksiköt pitää
rajata ja merkitä johdonmukaisesti aina samalla tavalla.
<P>
Käytännössä ihmiset ovat usein eri mieltä annotoitavien yksiköiden
rajauksesta ja nimikkeistä. Yhdessä sovitut annotointiperiaatteet
on helppo unohtaa, ja tyypillisesti annotoija muuttaa yhdenkin annotaatioprojektin
aikana näkemystään ''hyvästä annotaatiosta'' useita kertoja. Tämä
on aivan luonnollinen ilmiö, sillä monet teoreettiselta kannalta hyödylliset
puheen yksiköt eivät olekaan selkeästi erotettavissa ja rajattavissa
todellisesta puhesignaalista. Puheessa ei esimerkiksi normaalisti
ole taukoja sanojen välillä, ja puheentuoton aikana ihmisen ääntöelimistö
on käytännöllisesti katsoen jatkuvassa liikkeessä, joten äänteiden
rajatkin ovat ''sumeita''. Annotointi perustuu siis aina annotoijan
tulkintaan puheaineistosta.
<P>
Tämän oppaan tarkoituksena on antaa yleisiä ohjeita erilaisten yksiköiden
annotointia varten. Tavoitteena on, että jokainen tutkija käyttää
annotoidessaan tässä oppaassa määriteltyjä yksiköitä niin pitkälle
kuin se on mahdollista. Mikäli tutkija haluaa tarkentaa määritelmiä
tai käyttää kokonaan uusia yksiköitä, ne tulisi määritellä ja julkaista
virallisesti Puh-editorin avulla (ks. <A HREF="node11.html#sec:Uuden-annotaatioyksikon-maaritteleminen">7</A>).
<P>
<HR>
<!--Navigation Panel-->
<A NAME="tex2html462"
HREF="node5.html">
<IMG WIDTH="37" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="next" SRC="next.png"></A>
<A NAME="tex2html456"
HREF="node3.html">
<IMG WIDTH="26" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="up" SRC="up.png"></A>
<A NAME="tex2html450"
HREF="node3.html">
<IMG WIDTH="63" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="previous" SRC="prev.png"></A>
<A NAME="tex2html458"
HREF="node1.html">
<IMG WIDTH="65" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="contents" SRC="contents.png"></A>
<A NAME="tex2html460"
HREF="node63.html">
<IMG WIDTH="43" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="index" SRC="index.png"></A>
<BR>
<B> :</B> <A NAME="tex2html463"
HREF="node5.html">1.2 Akustisten analyysien hyödyntäminen</A>
<B> :</B> <A NAME="tex2html457"
HREF="node3.html">1. Mitä on annotaatio?</A>
<B> :</B> <A NAME="tex2html451"
HREF="node3.html">1. Mitä on annotaatio?</A>
  <B> <A NAME="tex2html459"
HREF="node1.html">Sisältö</A></B>
  <B> <A NAME="tex2html461"
HREF="node63.html">Hakemisto</A></B>
<!--End of Navigation Panel-->
<ADDRESS>
Mietta Lennes
2005-05-11
</ADDRESS>
</BODY>
</HTML>