اين روزها علم داده يا data science طرفدارهاي بسيار زيادي پيدا کرده و به سرعت در حال گسترش است. اما سوالي که براي بسياري از برنامه نويسان مطرح مي شود اين است که کدام
علم داده يا data science چيست؟
اگر در محيط وب جستجويي در مورد علم داده داشته باشيد حتما با دنيايي از مقالات طولاني و پيچيده مواجه مي شويد اما ما فقط يک جمله براي تعريف آن بيان مي کنيم. علم داده هنر جمع آوري، اندازه گيري، ارزيابي، مرتب سازي و آناليز مجموعه داده (data set) است. اين مجموعه داده مي تواند بسيار کوچک مثلا در حد شناسايي افراد بازديدکننده از سايت شما در يک بازه زماني خاص باشد يا داده هاي بسيار زيادي را شامل شود مثل بررسي وضعيت هزاران سنسور هوشمند در سراسر يک منطقه.
خب تا اينجا درمورد علم داده صحبت کرديم. در ادامه اين مطلب قصد داريم زبان هاي پايتون و R را از جنبه هاي مختلفي باهم مقايسه کنيم.
جمع آوري داده (data collection)
اولين تفاوت مهم زبان هاي پايتون و R در حوزه جمع آوري داده است. براي مثال زبان پايتون از انواع فرمت هاي گوناگون از csv گرفته تا json و حتي جداول sql پشتيباني مي کند. در حوزه توسعه وب هم پايتون اين اجازه را مي دهد که داده ها را از دنياي وب جمع آوري کنيد و در جداولي که خودتان ساختارش را مشخص کرده ايد، قرار دهيد. در مقابل زبان R براي وارد کردن داده هايي با فرمت excel ، csv و txt بهينه سازي شده است.
اکتشاف داده (exploring data)
مدل سازي داده (data modeling)
در زبان پايتون کتابخانه هاي قدرتمند و استانداردي مانند NumPy براي آناليز مدل سازي عددي يا SciPy براي محاسبات علمي وجود دارد. اما اگر برنامه نويسان بخواهند همين مدل سازي هاي علمي را در زبان R انجام دهند، بايد از پکيج هاي خارج از اين زبان استفاده کنند. البته ممکن است راه حل هايي در درون خود زبان R هم وجود داشته باشد ولي قطعا پيچيدگي هايي را به برنامه اضافه مي کند که در زبان پايتون وجود نداشته است.
تصويرسازي داده (data visualization)
تنها حوزه اي که زبان R نسبت به زبان پايتون برتري دارد، حيطه مصورسازي داده است. پايتون ابزارهايي مانند matplotlib دارد که مي توانند داده ها را به خوبي نمايش دهد. اما زبان R اساسا براي نمايش نتايج آناليزهاي آماري ساخته شده است و ماژول هاي گرافيکي آن امکان رسم نمودارها و چارت هاي مختلف را فراهم مي کند.
با اين تفاسير کدام زبان براي افراد مبتدي بهتر است؟
زبان پايتون و R هرکدام مزيت هاي متفاوتي در حوزه علم داده دارند اما سوال اصلي اينجاست که کدام يک براي افراد مبتدي و کارهاي اوليه مناسب تر است؟ با توجه به مواردي که گفته شد به نظر ميرسد زبان پايتون انتخاب اصلي براي اين دسته از افراد باشد. درست است که افراد تازه کار مي توانند از زبان R براي اجراي آناليزهاي ساده و پايه اي در مدت زمان کوتاهي استفاده کنند، اما براي اين که اين زبان و کتابخانه هاي آن را به درستي به کار ببرند، بايد ساعت ها براي يادگيري تلاش کنند. در مقابل
12 کتاب و مرجع آنلاين براي برنامه نويسان در سال 2021 - قسمت
به عنوان يک برنامه نويس بايد کدام مهارت هاي نرم (soft skill) خود
پايتون بهتر است يا R ؟ کدام زبان برنامه نويسي براي ورود به دنياي
داده ,زبان ,پايتون ,r ,مي ,برنامه ,زبان r ,علم داده ,برنامه نويسي ,است که ,زبان برنامه ,زبان برنامه نويسي ,برنامه نويسي پايتون ,براي افراد مبتدي
درباره این سایت