Gwnaeth Rhodri Tomos ddarn bach ynglŷn ag apertium-cy a ddangoswyd ar newyddion BBC Cymru ar 15ed Mai (mae'r dudalen we berthnasol yma). Mae trawsgrifiad a chyfieithiad, gyda chyfieithiad ceisiedig apertium-cy, ar gael yma.
Lawrlwythwch y Chwaraewr Flash i weld hyn.
Roedd Apertium yn llwyddiannus yn y Google Summer of Code 2009, a bydd un o'r projectau, gan Gabriel Synnaeve oddiwrth Grenoble yn Ffrainc, yn edrych ar wella'r cyfieithiad gan gyfuno allbwn apertium-cy ag allbwn peiriannau cyfieithu cod-agored eraill. Mae'r manylion yn y datganiad i'r wasg dyddiedig 12ed Mai.
Mae Fran Tyers a fi wedi cyhoeddi papur ar apertium-cy yn y Prague Bulletin of Mathematical Linguistics. Yn y papur rydym yn gwerthuso ansawdd y cyfeithiad gan ddefnyddio mesurau safonol, a siarad am fanteision datblygiad cod-agored ar gyfer ieithoedd lleiafrifol.
Arf ieithyddol newydd yw Geriaoueg ("geirfa" yn Llydaweg), wedi'i ddatblygu gan Fran Tyers ac yn seiliedig ar adnoddau iethyddol Apertium. Mae geiriau anhysbys yn yr iaith ar y wefan yyn popio i fyny yn eich iaith chi. Ar hyn o bryd, cynigir Llydaweg-Ffrangeg a Cymraeg-Saesneg, ond mae'n bosib cefnogi unrhyw iaith arall y mae Apertium yn ei chefnogi.
Cyfiethydd rhydd (GPL) awtomatig yw apertium-cy (mae cyfieithydd Saesneg-Cymraeg yn cael ei ddatblygu hefyd). Mae "rhydd (GPL)" yn golygu ei fod o dan General Public License y Free Software Foundation, felly mae'n costio dim, ond hefyd mae gennych y rhyddid o'i astudio, o'i newid, ac o'i ddosbarthu heb dorri'r gyfraith. Mae meddalwedd rhydd (GPL) yn cael ei ddefnyddio ledled y byd gan lywodraethau, cyrff cyhoeddus, cwmnïau, ac unigolion, o achos ei fanteision.
Mae apertium-cy yn rhan o project cyfieithu awtomatig o'r enw Apertium, sy'n creu meddalwedd i drosi testun mewn un iaith i destun mewn iaith wahanol. Datblygwyd Apertium gan Mikel Forcada a'i grŵp ymchwil Transducens ym Mhrifysgol Alacant, a Prompsit Language Engineering yng Ngwlad Falensia yn Sbaen. Hyd yn hyn, mae'r tîm aml-wladol Apertium wedi rhyddhau cyfieithyddion awtomatig ar gyfer 14 pâr o ieithoedd eraill (Catalaneg-Saesneg, Sbaeneg-Ffrangeg, ayyb), ac mae'n gweithio ar ddwsin arall. apertium-cy yw'r un cyntaf sydd ddim yn cynnwys iaith Romáwns fel Catalaneg neu Sbaeneg. Mae modd i chi lawrlwytho'r meddalwedd Apertium o'i wefan, sydd hefyd yn cynnwys wiki efo gwybodaeth am osod, a.y.y.b.
Datblygwyd apertium-cy dros y 9 mis diwethaf gan Francis Tyers a Kevin Donnelly. Mae Francis, y prif ddatblygwr, yn aelod o'r grŵp ymchwil Transducens, ac mae Kevin wedi bod yn gweithio yn annibynnol ar feddalwedd Cymraeg rhydd (GPL) ers pum mlynedd. Mae apertium-cy yn adeiladu ar ddau o'i brojectau, Eurfa (geiriadur Cymraeg) a Klebran (cywirydd gramadeg wedi'i seilio ar gywirydd gramadeg Gwyddeleg Kevin Scannell, Gramadóir). Ar hyn o bryd, mae apertium-cy yn cynnwys tua 10,000 o eiriau, ac oddeutu 150 o reolau ieithyddol.
Un fantais bwysig o ddefnyddio Apertium yw'r bosibilrwydd o ail-ddefnyddio'r gwaith a wnaed ar barau eraill o ieithoedd i roi hwb i'r broses o adeiladu cyfieithyddion eraill ar gyfer Cymraeg - gweler y papur yma (in Sbaeneg) am ragor o fanylion. Er enghraifft, gellir defnyddio'r cyfieithydd Sbaeneg i helpu creu cyfieithydd Cymraeg-Sbaeneg. Os oes siaradwyr Cymraeg yn yr Wladfa sy'n hiraethu am gyfieithydd awtomatig Cymraeg-Sbaeneg, buaswn ni'n falch iawn clywed gannddyn nhw!
Peidiwch â disgwyl cyfieithiadau perffaith o'r fersiwn cyntaf yma o apertium-cy! Ar y dudalen brofi mae 'na 21 o samplau i'w trïo. Mae'r rhannau byr yma yn dod o farddoniaeth, datganiadau swyddogol, nofelau, erthyglau papur newyddion, a di-ffuglen, a nid ydynt wedi'u golygu heblaw am atalnodi. Maen nhw'n rhoi syniad da o gryfderau a gwendidau apertium-cy ar hyn o bryd. Neu, os mae'n well gennych, mae modd i chi deipio i mewn eich rhannau eich hun, ond cofiwch y cyfyngiadau ar y dudalen brofi.
Mae apertium-cy yn cael ei wella yn barhaol, a dros y misoedd nesaf rydyn ni'n gobeithio gwella'r rheolau gramadegol (yn arbennig ar gyfer cymalau isradd), ehangu'r geiriaduron, a rhyddhau fersiwn cyntaf o gyfieithydd tebyg fydd yn cyfieithu o Gymraeg i Saesneg. Un o agweddau pwysig o ddatblygu meddalwedd rhydd (GPL) yw rhyddhau meddalwedd mor gynted ac y mae'n gweithio, er mwyn manteisio ar adborth oddiwrth defnyddwyr i wella'r meddalwedd.
Mae apertium-cy yn ddigon da ar hyn o bryd i chi gael syniad da o ystyr eang y testun (os nad oes gormod o eiriau anhysbys ynddo fo), felly mae'n ddefnyddiol i:
Yn y tymor hir, ac yn arbennig pan fydd y cyfieithydd Saesneg-Cymraeg ar gael, gallai apertium-cy ei ddefnyddio gan gyrff cyhoeddus, cwmnïau, grwpiau gwirfoddol, a.y.y.b. i wneud cyfieithiad bras o adnoddau cyhoeddusrwydd, dogfennau, ayyb, er mwyn cynyddu cynhyrchedd cyfieithwyr dynol.
Gallwch chi roi adborth i ni ar ein gwaith. Gallwch chi helpu i brofi fersiynau newydd. Gallwch chi ychwanegu geiriau i'r geiriadur. Gallwch chi helpu i ddatblygu rheolau newydd i wella'r trosiad gramadegol (bydd hyn yn hynod o bwysig ar gyfer y cyfieithydd Saesneg-Cymraeg).
Os corff cyhoeddus neu gwmni ydych chi sy'n creu testun dwyieithog, gallwch chi helpu gan roi copïau digidol i ni. Dydyn ni ddim eisiau ei ail-gyhoeddi, ond ei gadw mewn cronfa ddata fydd yn helpu ni greu tagiau a rheolau.
Gallwch helpu hefyd gan ofyn i'ch Aelod Cynulliad sicrhau fod adnoddau sy'n derbyn pres cyhoeddus ar gael dan drwydded rhydd. Gallwn ni ddatblygu'r cyfieithyddion yma yn llawer cyflymach os nad oes rhaid i ni greu geirfaoedd iddyn nhw o'r cyntaf un. Mae pres cyhoeddus wedi ei wario i greu geiriaduron a rhestri termau yn Gymraeg, ond ni allan nhw eu defnyddio gan apertium-cy a projectau tebyg gan nad ydyn nhw ar gael dan termau sy'n caniatáu dosbarthu rhydd. Mae pob munud a ddefnyddir yn ychwanegu geiriau yn funud na ellir ei ddefnyddio er mwyn datblygu'r meddalwedd. Buasai'n help mawr i'n gwaith pe gallai Bwrdd yr Iaith ailedrych ar y sefyllfa yma – ar ôl y cwbl, os mae datblygwyr yn Sbaen a'r Unol Daleithiau yn barod i helpu'r iaith, dylwn ni roi help iddyn nhw!
Os hoffech weld sut mae apertium-cy yn creu'r cyfieithiad, mae gwelydd ar gael yma. Mae modd i chi weld canlyniadau'r prosesu.