SMC/SoC/2007/Sarika: Difference between revisions

New page: == SARIKA == Speech recognition system for malayalam language
 
 
(7 intermediate revisions by 2 users not shown)
Line 1: Line 1:
== SARIKA ==
Student:[[User:Shyam  | Shyam.k]]


Mentor:[[User:Santhosh | Santhosh Thottingal]]


== SARIKA ==
[http://code.google.com/soc/2007/smc/appinfo.html?csaid=D0F2D63C08A2229 SOC application]
Speech recognition system for malayalam language
 
മലയാളത്തിലുള്ള സ്വരസംവേദിനി നിര്‍മ്മിയ്ക്കാനുള്ള ആദ്യ സംരഭമാണ് ശാരിക. വളരെ വലിയ തോതില്‍ സാധുതയുള്ള സാങ്കേതിക വിദ്യയാണ് സ്വരസംവേദനത്തിന്റേത്.പ്രാചീനമായ ആശയവിനിമയ ഉപാധികളില്‍ ഏറ്റവും ശാസ്ത്രീയമായ രീതിയാണ് സംസാരം.എത്രയും പുരോഗമിച്ചിട്ടും ഇന്നും അടുത്തുള്ള മനുഷ്യര്‍തമ്മിലുള്ള സമ്പര്‍ക്കത്തിന് ഏറ്റവും അനുയോജ്യമായ രീതിയാണ് സംസാരം. യന്ത്രങ്ങളോടും അതേ രീതിയില്‍ ഇടപെടാന്‍ പറ്റുന്നത് തീര്‍ച്ചയായും വിപ്ലവകരമായ മാറ്റമുണ്ടാക്കും. ലളിതമായ ആജ്ഞാനുവര്‍ത്തി(;-))കള്‍ മുതല്‍ ടെലിഫോണി ഉപയോഗിച്ചുള്ള  ടിക്കറ്റ് ബുക്കിങ്ങ്,മറ്റ് വിവര ശേഖരത്തിലുള്ള തിരച്ചില്‍ തുടങ്ങി ഇതിന്റെ പ്രയോഗങ്ങള്‍ക്ക് പരിമിതി ഭാവന മാത്രമാണ്.ഈ തരത്തിലുള്ള പ്രയോഗങ്ങള്‍ വികസിപ്പിയ്ക്കാന്‍ ഒരുപാടു വര്‍ഷത്തെ ഗവേഷണം അത്യാവശ്യമാണ്.സ്വരസംവേദിനിയുടെ അടിത്തറ,സംസാരവും ഭാഷയും എന്താണെന്ന് കമ്പ്യൂട്ടറിനെ പഠിപ്പിയ്ക്കുകയാണ്. അതിനായി സംസാര ഭാഷയുടെയും തത്തുല്ല്യമായ എഴുത്തു ഭാഷയുടേയും വലിയ ശേഖരം ആവശ്യമാണ്.
 
ഈ വലിയ ലക്ഷ്യങ്ങളുടെ ആദ്യ ഉദ്യമമെന്ന നിലയില്‍ , ഗ്നോം പണിയിട സംവിധാനത്തില്‍ ആജ്ഞകള്‍ നിര്‍വഹിയ്ക്കുന്നതിനുള്ള സംവിധാനമാണ് ഇപ്പോള്‍ വികസിപ്പിച്ചത്.കാര്‍ണ്ണിമെലണ്‍ സര്‍വകലാശാല (Carnegie Mellon University)വികസിപ്പിച്ചെടുത്ത സ്ഫിങ്ങ്സ് എന്ന സ്വരസംവേദിനി ഉപയോഗിച്ചാണ് ശാരിക പ്രവര്‍ത്തിയ്ക്കുന്നത്. തിരിച്ചറിയപ്പെടേണ്ട എല്ലാ വാക്കുതള്‍ക്കും  കമ്പ്യൂട്ടറിനു മനസ്സിലാകുന്ന രീതിയുള്ള മാതൃകകള്‍ നിര്‍മ്മിച്ചാണ് സ്വരസംവേദിനി പ്രവര്‍ത്തിയ്ക്കുന്നത്.അതിനായി ഇപ്പോള്‍ വളരെ ലളിതമായ മാതൃകയാണ് ഉപയോഗിച്ചത്. ഭാഷ സഞ്ചയം നിര്‍മ്മിയ്ക്കുകയും അതിലൂടെ വാക്കുകളേയും അതിലുപരി ഭാഷാ പരമായ സവിശേഷതകളും ഒള്‍‍ക്കൊള്ളുന്ന അടിസ്ഥാനപരമായ മാതൃക നിര്‍മ്മീയ്ക്കാലാണ് അടുത്ത ലക്ഷ്യം..
 
ശാരിക പരീക്ഷിയ്കാന്‍ ഗിറ്റില്‍ നിന്നും ഇറക്കി കമ്പൈല്‍ ചെയ്യൂക..