تبلیغات
 بامداد - زبان فارسی در اینترنت -1
بامداد
نوشته شده در تاریخ جمعه 18 اردیبهشت 1388 توسط محمدرضا جلالی | نظرات ()
طبقه بندی: فرهنگ و ادبیات، 
به نام خدا
با سلام و شب به خیر
ظاهرا موضوع فقر اطلاعات در فضای مجازی مورد توجه برخی دوستان قرار گرفته است لذا برای این پست به موضوع زبان فارسی در اینترنت می پردازم ، البته می دانم که برای نقد علمی این موضوع ابتدا باید به گستره زبان فارسی ، فارسی زبانان خارج از کشور ، فارسی زبانان افغانستان و تاجیکستان ، ایرانیانی که به زبانی غیر از فارسی ( بخصوص فینگلیش) مطلب می نگارند ، تعداد کاربران اینترنتی این زبان و...
نیز توجه کرد . همچنین باید به توانایی موتورهای جستجوی معروف مانند گوگل و یاهودر اندکس کردن صفحات فارسی و مشکلات جستجو و نمایه کردن با رسم الخط فارسی دقت کرد و به مقایسه وضعیت این زبان با سایر زبانهای دنیا که شرایط مشابهی دارند پرداخت.
 با این حال فقط اجمالا به ذکر چند نکته در این رابطه بسنده می کنم و بحث دقیقتر را به زمانی دیگر وا می نهم.
1. زبان فارسی چقدر در وب گسترش یافته است؟ من پاسخ دقیقی برای این پرسش ندارم ، فقط به چند آمار اشاره می کنم : در سال 85 ما 64000 سایت فعال فارسی و 200,000 وبلاگ فارسی داشتیم . در آبان 87 صدهزارمین دامنه ir.  ثبت شد. الان فقط سایت بلاگفا که یکی از ارائه دهندگان سرویس وبلاگ است بیش از یک میلیون وبلاگ ثبت شده دارد و پرشین بلاگ بیش از پانصدهزار وبلاگ (البته خیلی از آنها غیر فعال هستند.) یک راه ساده این است که کلمه ای فارسی را که فکر می کنی زیاد  تکرار می شود در گوگل جستجو کنی . اگر واژه "من"  را در جستجوی پیشرفته گوگل فقط در صفحات فارسی جستجو کنی به عدد  411,000,000می رسی که هنوز هم بدلیل صفحات تکراری زیاد دقیق نیست.بیاد داشته باشیم که  موتورهای جستجو فقط قادر هستند حدود 16 درصد از اطلاعات موجود در اینترنت را بازیابی كنند و اندازه وب نامریی تقریبا 500 برابر وب مریی است . دقت کنیم که موتورهای جستجویی مانند گوگل فقط سایتهای فارسی را که با استاندارد unicode نوشته شده باشند اندکس می کند لذا وب نامریی در مورد زبان فارسی باز هم بزرگتر می شود.
سه سال پیش دبیر انجمن فناوری اطلاعات گفته بود  که حدود هشت میلیون صفحه فارسی در وب وجود دارد یعنی یک ده هزارم کل صفحات وب در آن زمان. الان حدود 500,000 سایت فارسی و یک میلیون وبلاگ داریم که وبلاگها بیش از دوازده میلیون صفحه اندکس شده در گوگل داشته اند.
اگر به ویکی پدیای فارسی مراجعه کنی ما حدود 60،000 مقاله به زبان فارسی داریم رتبه 35 ویکی پدیا(حجم آن در سه سال اخیر پنج برابر شده است) که تقریبا نزدیک به زبان عربی و کمتر از اسپرانتو است!؟
تعداد مقالات ویکی پدیای انگلیسی نزدیک به 50 برابر است .البته همه می دانیم در زمینه وبلاگ نویسی با توجه به تعداد کاربران ، زبان فارسی جزو چند زبان اول است.قبل از فیلتر شدن فارسی زبان ها رتبه چهارم میزان كاربر در اوركات را به دست آوردند. برای آشنا شدن با مشکلات رسم الخط فارسی در اینترنت این لینک مفید است:
http://www.rayaamoozesh.com/2009/04/post-214.php
استاندارد جدید یونی‌کد هنوز در میان فارسی‌زبانان جا نیفتاده است. به عنوان مثال هنوز سایتهای خبرگزاری‌ها و روزنامه‌های اصلی ایرانی از کدبندی عربی استفاده می‌کنند. این آشفتگی کار جستجو در اینترنت را مشکل می‌کند. مثلاً اگر بخواهیم دنبال نام "کریم" بگردیم، باید درنظر گیریم که یک بار از "ک" فارسی و "ی" فارسی استفاده کنیم و یک بار از "ك" عربی و "ی" عربی. با توجه به این موضوع و نیز این که هنوز مشکل فاصله‌ی کوتاه در کلمات مرکب و نیز جدانویسی یا سرهم‌نویسی لغات به شکلی استاندارد و مورد پذیرش همگان حل نشده است جستجوی کامل و دقیق یک واژه به زبان فارسی در اینترنت بسیار سخت است.
2. این گسترش چقدر کیفی است؟ از چند دیدگاه می توان به این موضوع نگریست:
الف. سایتها و وبلاگهای زبان فارسی چقدر کاربردی هستند؟ پاسخ : بسیار کم. میزان انجام عملیات بانکی و خرید یا انجام امور اداری و کاری با اینترنت در ایران بسیار اندک است .بدلایل مختلف از جمله  عدم توسعه زیرساختهای مخابراتی ،کیفیت پایین خطوط ارتباطی و سرعت اندک ، دسترسی ناکافی ،  سیستم اداری ناکارآمد و به روز نشده ، عدم فرهنگ شدن این امر ، نقص قوانین ، عدم رشد بازار اینترنتی و...
دقت کنید که الان سالهاست می خواهند شمارش آرا انتخاباتی را رایانه ای کنند و هر دوره به دوره بعد موکول می شود ،، دولت الکترونیک هنوز اندر خم یک کوچه است . فرض کنید کارمندان امور اداری خویش را در منزل و با اینترنت انجام دهند!؟ و یا تصور کنید که با این اینترنت هندلی بخواهیم آموزش از راه دور داشته باشیم یا سمینار آنلاین برگزار کنیم و...
ج. این فضا از جهت کسب اطلاعات چقدر مفید است؟   پاسخ : اندک . اولا سایتهای معتبر و غیرمعتبر و اطلاعات صحیح و نادرست به دشواری قابل تشخیصند. ثانیا اطلاعات منسجم و طبقه بندی شده نیستند فرض کنید شما وارد سایت رسمی یک باشگاه می شوید ولی اغلب این سایتها  بسیار دیر به روز می شوند وفاقد اطلاعات ضروری از جمله تاریخچه دقیق باشگاه  ، اخبار باشگاه و سیاستهای آن هستند . جالب است که بدانید سایت رسمی باشگاه فوتبال ذوب آهن هیچ اطلاعاتی راجع به زندگینامه سرمربی این تیم " ابراهیم زاده " و میرعامل آن ندارد!؟
ثالثا اغلب سایتها یا وبلاگها تخصصی نیستند و به موضوعات مختلف و خبرهای گوناگون پرداخته اند ، به زبان  دیگر محتوای اینترنتی زبان فارسی غنی نیست بلکه بیشتر تفننی است. 
بررسی یكصد سایت پر مراجعه وب از طرف كاربران ایرانی نشان می دهد ،‌ سایت های مربوط به سرویس دهنده های وبلاگ ، سایت های مربوط به شبكه های اجتماعی و دوست یابی و پایگاه های خبری ،‌ سه موضوع مهم و مورد علاقه كاربران ایرانی در وب است .. قبل از اینکه گردانندگان این سایتها و کاربران آن را به ابتذال و هدردادن وقت کاربران محکوم کنیم آیا نباید از اداره کنندگان سایر سایتها از جمله سایتها و وبلاگهای علمی بخاطر عدم موفقیت در جذب مخاطب انتقاد کنیم؟ ما چند سایت داونلود کتاب الکترونیکی فارسی داریم؟ ( فکر کنم زیر 20 تا) چند کتاب از نویسندگان ما( اعم از علمی ، ادبی ، هنری یا تاریخی) بصورت فایل با فرمتهای قابل جستجو در اینترنت قرار گرفته است؟
ده سایتی که کاربران اینترنتی ایرانی از آنها بیشتر بازدید نموده اند (به نقل از سایت الکسا) گوگل ، یاهو ،بلاگفا ، فیس بوک ، یوتیوب، میهن بلاگ ، persianblog، blogger ،cloob ، msn  می باشند.
تنها سایتهای بانکی یا دولتی یا شرکتها که جزو صد سایت پربازدیدکننده هستند سازمان سنجش (21) ،پیام نور(41) ، همراه اول (68) ، بانک ملت (77) ، ، سایت مدارک علمی ایران(70) و ایران خودرو(91) می باشند. البته  فراموش نکنیم که اطلاعات سایت الکسا امروزه بخصوص برای زبان فارسی زیاد دقیق نیست.
د. سایتهای رسمی ادارات دولتی ، بانکها و شرکتها چقدر کاربردی هستند؟ پاسخ هنوز هم بسیار کم است. دلایل آن هم بسیار زیاد است، مثلا عدم گسترش بانکداری الکتریکی . در مورد شرکتها که موضوع پیچیده تر نیز می شود مثلا بسیاری از این شرکتها سایتهایی به زبان فارسی دارند که برای کاربران خارجی مفید نیست یا این سایتها هیچ نوع خدمتی جز ارائه برخی اطلاعات ناقص به کاربران نمی دهند یا در مورد خرید بدلایل زیادی از جمله تحریمها و نداشتن ارتباطات مالی وسیع و ایمن با خارج از کشور ، مشکلات گمرکی و حمل و نقلی و... عملا هیچ امکانی برای اینکار وجود ندارد.
موفق باشید



درباره وبلاگ

این وبلاگ بیشتر به موضوعات فرهنگی (بویژه سینما ) ، ورزشی ( فوتبال) ، سیاسی و مسائل روز می پردازد
پست الکترونیک
تماس با مدیر
RSS
ATOM
جستجو
آخرین مطالب
آرشیو
موضوعات
نویسندگان
پیوند ها
پیوندهای روزانه
صفحات جانبی
آمار سایت
بازدیدهای امروز : نفر
بازدیدهای دیروز : نفر
كل بازدیدها : نفر
بازدید این ماه : نفر
بازدید ماه قبل : نفر
تعداد نویسندگان : عدد
كل مطالب : عدد
آخرین بازدید :
آخرین بروز رسانی :