اصول چاپ و نشر

عناصر زبان نوشتاری بخشی قابل توجه زبان

عناصر زبان نوشتاری

عناصر زبان نوشتاری بخشی قابل توجه زبان

عناصر زبان نوشتاری بخشی قابل توجه زبان به ساختارهای زبان، بخش ها و توصیف هر کدام این بخش ها در حوزه ویراستاری می پردازد. تا جایی که به ویرایش و نگارش مربوط می شود، عناصر زبان زبان را می توان به دو بخش مجزا تقسیم کرد:

  1. زبان نوشتاری،
  2. زبان گفتاری؛

که در این تقسیم بندی، معیار، رسانه زبان، یعنی نوشتار و گفتار است. هر یک از این دو مقوله را می توان به اجزا و عناصر کوچکتر نیز تفکیک کرد، که در این صورت، بحث درباره زبان و به ویژه نگارش، آسانتر می شود. (البته ضرورتی وجود ندارد که منظور از “اجزا و عناصر” و مقوله بندی زبان به طور دقیق روشن باشد. در نوشته حاضر، عناصر زبان نوشتاری ، و در بخش بعد عناصر زبان گفتاری تشریح می شوند.

عناصر زبان نوشتاری

عناصر زبان نوشتاری

برای شناخت عناصر زبان نوشتاری (Written Language)، اجزای آن را به پنج مقوله تقسیم می کنند، که عبارت اند از:

  1. متن،
  2. جمله،
  3. کلمه
  4. تکواژه
  5. حرف.

عناصر زبان نوشتاری

  1. متن

در عناصر زبان نوشتاری متن (Text)، بزرگترین واحد تقسیم بندی نوشتار است که مجموعه ای است از تعدادی جمله؛ مثلا یک پاراگراف ۵ جمله ای، یک نامه، و یک کتاب داستان. به طور کلی، متن، هر نوع نوشتار است که از بیش از یک جمله تشکیل می گردد. بنابر این، حتی دو جمله پشت سرهم را نیز می توان متن به حساب آورد. در نوشته های بعدی، شرح مفاهیم و موضوعات مربوط به متن، به تفصیل خواهد آمد. در ضمن، یکی از مباحث زبان شناسی به نام زبان شناسی متن (Text Linguistics) نیز به این موضوع اختصاص دارد.

  1. جمله

در عناصر زبان نوشتاری جمله (Sentence)، پس از متن، بزرگترین واحد نوشتار است که از یک یا چند “کلمه” تشکیل می شود. شرح مبحث جمله در کتاب های دستور زبان و نحو می آید؛ اما در نوشته حاضر نیز به شرح برخی مفاهیم مربوط به جمله، پرداخته شده است.

  1. کلمه

در عناصر زبان نوشتاری کلمه (Word)، مجموعه ای است از یک یا چند تکواژ (تعریف تکواژ در زیربخش بعدی می آید). در اینجا برای سادگی، عبارت “Phrase” و اصطلاح “Idiom” نیز کلمه به حساب آمده اند، که البته می توان آنها را نیز به عنوان یک مقوله دیگر تفکیک کرد و یا در مقوله جمله قرار داد. برخی از مفاهیم مربوط به کلمه، مثلا اقسام آن، در کتاب های دستور زبان می آیند. در نوشته حاضر، فقط به مفاهیمی از مبحث کلمه پرداخته شده است که در ویرایش و نگارش کاربرد دارند.

  1. تکواژ

در عناصر زبان نوشتاری تکواژ (Morpheme)، مجموعه ای است از تعدادی حرف، و “کوچکترین جزء معنادار در زبان نوشتاری” است. مثلا در کلمه اسب ها، دو جزء معنادار وجود دارد که عبارت اند از اسب و ها. هیچ یک از این دو جزء را از نظر معنایی نمی توان به اجزای کوچکتر تقسیم کرده و از این روی، هر یک از این دو جزء معنادار را یک تکواژ می نامند.

همچنین، کلمه worked از دو تکواژ work و ed تشکیل می شود که هیچ یک را نمی توان به اجزای معنادار کوچکتر تقسیم کرد. به عبارت دیگر، تکواژ مجموعه ای است متشکل از چند حرف (و گاهی یک حرف)، که دارای یک معنای “غیردستوری” یا “دستوری” است.

عناصر زبان نوشتاری

تکواژ غیردستوری در عناصر زبان نوشتاری

“تکواژ غیردستوری” تکواژی است که به تنهایی معنای معینی دارد؛ مثلا “اسب” و یا “work” که یک تکواژ است و معنای معینی دارد، و به تنهایی نیز می تواند بیاید.

تکواژ دستوری

اما “تکواژ دستوری” تکواژی است که معنای آن به تکواژ دیگری از کلمه بستگی دارد، و خود به تنهایی نمی آید؛ مثلا تکواژ “ها” در کلمه “اسبها”، و تكواژ “ed” در کلمه .Worked

با توجه به تعریف تکواژه تکواژ غیردستوری را تكواژ آزاد (Free Morpheme)، و تكواژ دستوری را تكواژ مقید (Bound Morpheme) نیز می توان نامید. نمونه های زیر، معنای تکواژ و دو نوع آن را به روشنی نشان می دهند:

  • كلمة کتابخانه متشکل از دو تکواژ است: “کتاب” و “خانه”. هر یک از آنها دارای معنای معینی است و قابل تقسیم به اجزای معنادار کوچکتر نیست. “کتاب” و “خانه” هر دو تکواژهای غیردستوری یا آزاد هستند. همچنین، Workbook از دو تکواژ غیردستوری یا آزاد “work” و “book” تشکیل می گردد؛
  • کلمه می روم، متشکل از سه تکواژ است: “می”، “رو” ، و “م” . اولی و سومی تکواژ دستوری یا مقید هستند، و دومی تکواژ غیردستوری یا آزاد است. روشن است که هیچ یک از این تکواژها قابل تقسیم به اجزای معنادار کوچکتر نیست. همچنین، “Unlikely” متشکل از سه تکواژ است: “Un” و “Like” و “Ly” که اولی و سومی مفید هستند، و دومی آزاد است.
  • عناصر زبان نوشتاری
  1. حرف

در عناصر زبان نوشتاری حرف (Letter)، کوچکترین واحد زبان نوشتاری متمایز کننده معنا است؛ مثلا “د” و “م”. بنابر این، در کلمه “باشد” که از چهار حرف تشکیل شده است، اگر حرف چهارم آن به “م” تغییر داده شود، معنای کلمه تغییر می کند و به “باشم” تبدیل می شود.

“حرف” می تواند چاپی و یا دستنوشتی باشد. البته بين حرف چاپی و دستنوشتی از نظر تعریف حرف تفاوتی وجود ندارد، اما در ویرایش، باید بین آنها تمایز قائل شد، زیرا هر یک دارای مشخصات مربوط به خود است. و در حروف شناسی و زبان شناسی، واحد بعد از حرف نیز تعریف شده که نخست، نویسه واره (Grapheme) یا حرفواره است.

عناصر زبان نوشتاری

نویسه واره در عناصر زبان نوشتاری

در عناصر زبان نوشتاری نویسه واره کوچکترین نمادی است که در نوشتار به کار می رود و مانند “حرف” موجب تمایز معنایی می شود؛ مثلا نمادهای نوشتاری <م>، <a>، < >، و < & >، که هر یک می تواند معنا را تغییر دهد. نویسه واره یک مفهوم انتزاعی است و خود در عمل می تواند دارای صورت های مختلفی باشد که البته تمایز معنایی ایجاد نمی کنند.

مثلا نویسه واره <a> دارای صورت های a و A و غیره است که به شیوه خط و نگارش و حروفچینی بستگی دارد؛ اما این صورت ها تمایز معنایی ایجاد نمی کنند.

برای مثال، cat و CAT و حتی CA و غيره، صورتهایی “واقعی” از یک آرایش متشکل از سه نویسه واره “انتزاعی” <c> و <a> و <t> هستند. هر یک از صورتهای مختلف یک نویسه واره را یک نویس (Graph) یا همان گراف می نامند. بنابر این، a و A در نویسی از نویسه واره <a> هستند.

قابل اشاره است که در حروف شناسی و زبان شناسی، به هنگام مطالعه نویسک های مختلف متعلق به یک نویسه واره، هر یک از صورتهای مختلف را یک دگر نویسك (Allograph) یا نویسك گونه می نامند. و مثلا می گویند نویسه واره <a> در فلان دستگاه نوشتاری دارای ۲ یا ۳ با ۵ دگرنويسک است.

عناصر زبان نوشتاری

نویسه واره در زبان فارسی

در زبان فارسی ۳۲ با ۳۳ حرف الفبا وجود دارد که عبارت اند از: آ ب پ ت ث ج چ ح خ د ذ ر ز ژ س ش ص ض ط ظ ع غ ف ق ک گ ال م ن و ه ی.

هر یک از این حروف یک نویسه واره محسوب می شود. اما در نوشتار فارسی نویسه واره های دیگری نیز به کار می رود که برخی از آنها عبارت اند از:

؟ ، ( ) !

از سوی دیگر، هر یک از نویسه واره های نوشتار فارسی دارای چند صورت متفاوت هستند که البته تمایز معنایی ایجاد نمی کنند. مثلا “ب” و “بـ” و غیره، نویسکهای متفاوت نویسه وارة <ب> هستند.

بیشتر حروف الفبای فارسی، دارای صورتهای “چسبان” (مثلا “ب”، “تنها” مثلا “ی”)، وسط (مثلا “ـع”)، و آخر (مثلا “ـع”) هستند. البته تعداد صورتهای متفاوت هر حرف الفبای فارسی به نوع خط نیز بستگی دارد. مثلا در حروفچینی دستی و خطاطی، حرف “ب” دارای چهار گونه مختلف است:

  1. “بـ” آغازین که “ب” اول نامیده می شود. مثلا در باران؛
  2. “ـبـ” میانی که “ب” وسط نامیده می شود. مثلا در شبنم:
  3. “ـب” آخر چسبان، مثلا در لب؛
  4. “ب” آخر تنها، مثلا در آب.

اما همین حرف در ماشین تحریر و برخی سیستم های حروفچینی، و نوشتار ساده فارسی فقط دارای دو گونه متفاوت است:

  1. “ب” اول و وسط؛
  2. “ب” تنها و آخر.

عناصر زبان نوشتاری

استثناها در عناصر زبان نوشتاری

در عناصر زبان نوشتاری در حالت کلی، هر یک از حروف الفبای فارسی، مشابه حرف “ب” دارای چهار صورت (اول، وسط، آخر تنها، و آخر چسبان) است، به جز حروف:

آر د ذ ر ز ژ و

که حداکثر فقط دارای دو صورت تنها و چسبان هستند. (حروف ط و ظ نیزه بسته به سیستم حروفچینی، ممکن است حداکثر فقط دارای دو صورت تنها و چسبان باشند). بنابر این، تعداد صورتهای مختلف ۳۳ حرف اصلی الفبای فارسی، می تواند بین حداقل ۵۷ و حداکثر ۱۱۶ باشد.

واژه پردازی کامپیوتری

در واژه پردازی کامپیوتری، علاوه بر ۳۳ حرف الفبای فارسی، باید حروف “لا”، “ث”، و “ء” را هم به عنوان حروف الفبا به حساب آورد. بنابر این، با افزودن این حروف، تعداد صورتهای مختلف حروف فارسی به ۶۰ تا ۱۲۱ می رسد.

در برخی از زبانها، “حروف الفبای” دو حرفی نیز وجود دارد که این، جدا از حروف ترکیبی است. مثلا در اسپانیولی، حرف الفبای “CH” یک حرف مستقل است و در فرهنگها و فهرستهای الفبایی در بخش مستقلی، پس از انتهای حرف “C”، و بلافاصله قبل از حرف “D” می آید. اما در همین زبان، ترکیب “QU”، جزو حروف ترکیبی است و حرف الفبا محسوب نمی شود.

در فارسی، “لا” همواره جزو حروف ترکیبی بوده است، اما در واژه پردازی فارسی معمولا باید همانند “CH” اسپانیولی به عنوان یک حرف منفرد درنظر گرفته شود.

نشانه همزه روی “الف”، “و”، و “ه” نیز ممکن است “یک نماد یا حرف فرعی” فارسی به حساب آورده شود. (مثلا در “رأس”، “مؤلف”، و “خانه”. با این حساب تعداد صورتهای حروف فارسی به ۶۱ تا ۱۲۲ می رسد.

إعراب

إعراب (Vocalization) نیز جزو نمادهای نوشتار فارسی است که چند صورت مختلف دارد. اعرابهای فارسی، همانند حروف الفبا، از زبان عربی گرفته شده اند. مهمترین اعرابهای فارسی عبارت اند از:

  1. فتحه، مثلا در بَرف؛
  2. کسره، مثلا در سِه؛
  3. ضمه، مثلا در سُرخ؛
  4. تشدید، مثلا در بزّه؛
  5. تنوین، مثلا در اولاً.

بقية إعرابها شامل سکون و تنوینهای دیگر کاربرد بسیار کمتری در نگارش فارسی دارند، و معمولا حذف آنها منجر به بروز ابهام نمی شود.

روش رمزبندی و نمادگذاری حروف الفبا

در عناصر زبان نوشتاری و در واژه پردازی کامپیوتري فارسی، دو روش برای رمزبندی و نمادگذاری حروف الفبا و اعراب گذاری آنها وجود دارد:

  1. هر حرف اعراب دار با دو نماد پشت سر هم مشخص می شود. مثلا /بـ/-ُ/ که در حافظه کامپیوتر با دو نماد پشت سر هم مشخص، و در دو خانه حافظه ذخیره می گردد. اما هنگام چاپ، این دو نماد به صورت یک حرف منفرد اعراب دار (ب) چاپ می شود؛
  2. هر حرف اعراب دار فقط با یک نماد مشخص می گردد. در این صورت، برای هر حرف الفبا چندین صورت اعراب دار وجود خواهد داشت. مثلا اگر تعداد اعرابها پنج باشد، پنج نوع حرف “ب” وجود خواهد داشت: شامل “بـ”،“ بَـ”، “بِـ”، “بُـ”، و “بّـ” (که “بًـ” کاربردی ندارد).

بنابر این، اگر تعداد نمادهای حروف چاپی فرضا ۸۰ باشد، و تعداد اعرابها ۵ فرض شود، مطابق روش اول فوق، نمادگذاری حروف فارسی با ۸۵ نماد صورت می پذیرد؛ و مطابق روش دوم فوق، این نمادگذاری با ۴۰۰ نماد انجام می شود، زیرا مطابق این روش، هر حرف چاپی دارای پنج صورت اعراب دار است. البته در اینجا برای سادگی، محدودیتهای اعرابها، مثلا تنوین روی حروف غیر از الف، با اعراب روی “آ”، و نیز حروف چاپی بدون اعراب، نادیده گرفته شده اند.

هر یک از دو روش فوق دارای مزایا و معایبی است، اما در کامپیوتر معمولا از روش اول استفاده می شود. مطالعه این ویژگی دوگانه حروف الفبای فارسی، علاوه بر حروفچینی و حروف شناسی، در رمزبندی، رمزی سازی، هوش مصنوعی، و نظریه اطلاعات کاربرد دارد.

بازگشت به لیست

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *