دراسة عن تحليل تردد الحروف العربية | | Print | |
هذه الوثيقة موجودة تحت ترجمات أخرى [ رمز: English en00001 ]، يمكن أيضًا الوصول إليها عبر صفحة الوثائق. 👋👋👋 جربوا أعناب🍇، الباحث عن كلمات القرآن الكريم بدقة وسرعة فائقتين. هنا ڤيديو من 6 دقائق للتعرف عليها، وهنا ڤيديو مفصل من 30 دقيقة، وهنا التطبيق. مقدمةأثناء تصميم انتلارك (لوحة مفاتيح انتلرن العربية)، التصميم الجديد الذي يسمح لك بأن تطبع بالعربي مستخدما معرفتك للطباعة بالإنجليزي، احتجت بطبيعة الحال لمعرفة تردد كل حرف في الحروف العربية، وذلك للقيام بقرارات مدروسة للتوفيق من مفاتيح اللوحات اللاتينية إلى حروف وعلامات اللغة العربية. كان من الغريب أن لا نجد جداول أو بيانات عن تردد الحروف العربية على الإنترنت كما هو متوفر للحروف الإنجليزية [1، 2، 3]! شكَّل هذا ميلاد انتلايز، محلل تردد حروف وكلمات انتلرن، والذي سيساعد فيما بعد على تقديم إحصاءات ودراسة عن تردد الحروف العربية. باديء ذي بدء: ما الذي يُحصى في النصوص المدخلة؟من المعلوم أن الحروف العربية تتألف من 28 حرف رئيسية، هذه الحروف المعروضة في جدول 1 من 1 إلى 28. ولكن عند الكتابة، هناك ثمانية حروف أخرى معتمِدة تسكن في الخلايا 29 إلى 36 ذات استعمال متردد أيضا. لو كتَّلنا الـ 8 الأخيرة مع الحروف الرئيسية اعتمادا على التشابه الشكلي أو الصوتي، ينتهي بنا المطاف للترتيب المعروض في جدول 2. للدقة في التحليل، انتلايز لا يُكتِّل، فهو يدع ذلك للمستخدم أذا أراد. لاحظ هنا أن الترتيب الهجائي للحروف يتماشى مع المألوف في الترتيب بدلا من الترتيب على حسب معيار Unicode.
تردد الحروف العربية باستخدام القرآن فقط كمصدر إدخالفي هذا الجزء، دعونا نأخذ فقط القرآن كمصدر للمعلومات المدخلة لإنتاج توزيع الترددات في الحروف العربية. جدول 3 يعرض معلومات تردد الحروف بناءً فقط على سور القرآن الـ 114. الترتيب المشهود يعتمد على معيار Unicode في ترتيب الحروف العربية. فيما يلي وصف لأعمدة جدول 3 الثلاثة:
تردد الحروف العربية باستخدام مراجع أخرىهذا العمل لن يُعدُّ كاملا بدون أخذ إحصاءات عن ترددات الحروف من مصادر أخرى غير القرآن. فيما يلى نبذة عن المصادر الأخرى التي استعملت.
تكون هذه المصادر مجتمعة ما يفوق 3,378 صفحة بها 1,297,259 كلمة تتألف من 5,122,132 حرف. جدول 5 يعرض إحصاءات المراجع المذكورة.
الشكلان 1 و 2 بالأسفل يعرضان بيانات جدول 5 كرسم بياني.
نتائج تسترعي الإهتمامأثناء البحث عن مصادر لترددات الحروف على الإنترنت، عثرت على بعض المواقع قد تجد بعض التسلية في المعرفة عنها. تردد حروف القرآن، بالإنجليزي!في [7]، أجريت إحصاءات تردد الحروف على قرآن مترجم إلى الإنجليزية. من الصعب الوصول إلى أهمية هذا الجهد حيث أن الإحصاءات إجريت على كلمات انجليزية! من ناحية نستنتج مدى أهمية القرآن كمصدر للمعلومات حتى يؤخذ تردد حروفه، ولكن من ناحية أخرى يمكننا استنتاج أن نتائج التحليلات سوف تتوافق في النهاية مع ما هو معروف عن تردد الحروف الإنجليزية. كسر الشفراتمن الأمور العجيبة أنه منذ 1000 سنة تقريبا، تجد وصفا كاملا عن بعض الطرق المستخدمة في كسر الشفرات المكتوبة، وبخط اليد! أتود إلقاء نظرة؟ إلق نظرة على [8]. لادِقَّة غير مفسرة!كما أسلفت في البداية قبل الشروع في بناء انتلايز، همت في الإنترنت بعضا من الوقت علني أجد موقعا عن تردد الحروف العربية. وجدت واحدًا! ورقة علمية في سنة 2005 ألفت من قبل طالبة دكتوراه (حينذاك على الأقل) في بريطانيا. في ورقتها في جدول 1، ذكرت إحصاءات الكلمات في 24 سورة. مصدر السور الذي استُخدم في البحث يسترعي الإنتباه، حيث أن القرآن كله نقل حرفيا إلى اللغة الإنجليزية كلمة بكلمة، تقريبا لمساعدة غير الناطقين بالعربية على ضبط القراءة. ما لم استطع فهمه هو عدد الكلمات المدونة لكل سورة في ذلك الجدول. الأرقام بعيدة عن الصحيح بـ 100 أحيانا. لقد دققت المراجعة على إحصاءات سورة الكهف كنموذج. المسجل في تلك الورقة أن بسورة الكهف 1,489 كلمة، ولكن انتلايز يخبر أن عدد الكلمات 1,583 (وهذا هو عدد الكلمات الذي توصلت إلى عده بدون أدوات، صفحة صفحة، سطرا سطرا). سأشارككم أي رد منها على استفساري الذي بعثته لها عن كيف وصلت إلى إحصاءاتها المسجلة. مراجع[1] http://en.wikipedia.org/wiki/Letter_frequencies [2] http://en.wikipedia.org/wiki/Frequency_analysis [3] http://www.simonsingh.com/The_Black_Chamber/frequencyanalysis.html [4] http://en.wikipedia.org/wiki/Alkindi [5] http://cs-exhibitions.uni-klu.ac.at/index.php?id=279 [6] http://www.muslimheritage.com/topics/default.cfm?ArticleID=372 [7] http://www.intratext.com/IXT/ENG0027/_STAT.HTM [8] http://www.simonsingh.net/The_Black_Chamber/crackingsubstitution.html اتصل بناأي تعليقات، معلومات غير دقيقة أو غير صحيحة، إضافات أو روابط ذات علاقة؟ لا تتردد في إرسال خواطرك إلينا لتحسين جودة ودقة هذه المقالة. شكرًا لكم. Comments (8)
Re: Help me, please
I made a quick search but as expected, you won't find the resources you're looking for published that easy; you probably have to contact specialized academic departments for that. Intellyze, the software tool made by Intellaren, will calculate word frequency for you, but only local to what you feed it.
If you or any one finds such resources, please send them here and we will publish them. دراسة رائعة جداً
السلام عليكم
من خلال بحثي في النت عن الحروف العربية ، حيث كنت قد بدأت بحثاً لتشفير الحروف العربية لعرضها على لوحة عرض مشابهة للوحة العرض 7 سيقمنت ، لم أجد أروع من هذه الدراسة ٠٠٠ بالفعل و أنا أعتزم وضع الأساسات الأولية لوحدة عرض إلكترونية و تشفير لحروف اللغة العربية ، نظراً لعدم وجودها في الحيز العملي ٠ بارك الله فيك و زادك علماً و نفعاً عيسى الشريف |
Help keep Intellaren up and running with more offerings.
Help us build these products: