Python-or-R-programming
Share on facebook
Share on twitter
Share on linkedin

Nếu bạn đang bắt đầu tìm hiểu trong lĩnh vực Phân tích dữ liệu, bạn sẽ thấy một trong những kỹ năng quan trọng nhất là sử dụng ngôn ngữ lập trình thống kê. Data Analyst sử dụng SQL để tương tác với Cơ sở dữ liệu nhưng khi nói đến làm sạch, phân tích, trực quan hóa dữ liệu, bạn sẽ cần đến Python hoặc R. Vậy Python hay R quan trọng hơn để làm Phân tích dữ liệu (Data Analyst)?

A. Một số điểm khác nhau giữa R và Python

Cả hai ngôn ngữ Python hay R trên đều miễn phí cùng với một số thư viện miễn phí, chúng đều có thể chạy trên các hệ điều hành MacOS, Window và Linux. Cả hai đều có thể xử lý các công việc của Data Analyst và được cân nhắc là khá dễ học cho người mới bắt đầu. Trước khi tìm hiểu sâu hơn về điểm khác biệt giữa hai công cụ, chúng ta sẽ tìm hiểu tổng quan về chúng và sẽ giải đáp liệu học ngôn ngữ nào trước thì phù hợp hơn.

Python or R
Python

Python là một ngôn ngữ bậc cao, sử dụng cho nhiều mục đích chung và khá tương tự với ngôn ngữ chúng ta hay sử dụng. Python có thể được sử dụng cho nhiều yêu cầu công việc khác nhau, nhưng 3 lĩnh vực được áp dụng nhiều nhất là :

  • Khoa học dữ liệu và phân tích dữ liệu
  • Xây dựng và phát triển website
  • Tự động hóa
R

R là một môi trường lập trình và là ngôn ngữ lập trình thống kê, được sử dụng phần lớn cho mục đích thống kê và trực quan hóa dữ liệu. Khả năng ứng dụng của R có thể được chia ra làm 3 lĩnh vực lớn sau đây:

  • Xử lý dữ liệu
  • Phân tích thống kê
  • Trực quan hóa dữ liệu

Ngôn ngữ bậc cao những ngôn ngữ gần với ngôn ngữ của con người, chúng ta có thể dễ dàng đọc và hiểu được. (Python, C#, C++, Java…). Ngôn ngữ bậc thấp là những ngôn ngữ gần với ngôn ngữ của máy tính hơn và máy tính có thể hiểu dễ dàng hơn.

B. Nên chọn ngôn ngữ nào để bắt đầu?

Bạn đều có thể chọn một trong hai ngôn ngữ trên để bắt đầu học. Cả hai đều là những ngôn ngữ cần thiết và cho phép bạn thực hiện những yêu cầu phân tích mà bạn cần. Ngôn ngữ nào sẽ phù hợp hơn phụ thuộc vào sở thích, nền tảng và mục tiêu nghề nghiệp của bạn.

1. Kinh nghiệm làm việc và học tập

R hay Python đều được xem là ngôn ngữ dễ học cho người mới bắt đầu. Python được thiết kế ban đầu cho phát triển phần mềm. Nếu bạn đã có kinh nghiệm sử dụng các ngôn ngữ C hay Java, bạn sẽ có thể chọn học Python trước. Nếu bạn có nền tảng là thống kê thì bạn nên tham khảo học R trước, sẽ dễ dàng hơn một ít so với Python.

2. Yêu cầu của nhà tuyển dụng hoặc công ty bạn đang làm

Nhìn chung, việc lựa chọn Python hay R cũng sẽ phụ thuộc vào yêu cầu của công ty bạn, sử dụng ngôn ngữ giống với team của bạn đang sử dụng sẽ là một ý tưởng phù hợp hơn. Điều này sẽ hỗ trợ cho việc share những ý tưởng về đoạn code và kết hợp làm dự án cùng nhau.

3. Về điểm mạnh và điểm yếu của 2 ngôn ngữ

Python hay R đều có thể thực hiện các yêu cầu xử lý dữ liệu giống nhau, nhưng mỗi công cụ sẽ có một thế mạnh đặc trưng. Nếu công việc của bạn phần lớn tập trung vào một vai trò cụ thể, bạn sẽ nên chọn công cụ mạnh hơn để thực hiện yêu cầu đó.

Python

Xử lý khối lượng lớn dữ liệu

Xây dựng mô hình máy học, học sâu

Thực hiện những yêu cầu không mang tính thống kê như đào dữ liệu từ Web, lưu dữ liệu vào Database,…

R

Tạo ra những biểu đồ trực quan với dữ liệu

Xây dựng những mô hình thống kê

Phát huy tối đa các đặc điểm của thống kê với hệ sinh thái cực kỳ mạnh

4. Con đường nghề nghiệp.

Hãy suy nghĩ về ngôn ngữ mà phù hợp với mục tiêu dài hạn của bạn. Nếu bạn đam mê về tính toán thống kê và trực quan hóa dữ liệu. R có thể phù hợp hơn
Ngược lại, nếu bạn muốn trở thành một nhà Khoa học dữ liệu, làm việc với dữ liệu lớn, trí tuệ nhân tạo (AI) hay xây dựng mô hình Máy học, Học sâu. Hãy bắt đầu với Python.

C. Làm sao để học R hay Python hiệu quả. Các sự lựa chọn để bắt đầu

Cả hai ngôn ngữ này đều là ngôn ngữ tuyệt vời cho phân tích dữ liệu. Chúng đều phù hợp cho người mới bắt đầu và không yêu cầu kiến thức lập trình. Nếu bạn chọn ngôn ngữ nào thì cũng đều có những nguồn cung cấp tài liệu và hướng dẫn rộng lớn và miễn phí. Sau đây là một số lựa chọn bạn có thể xem xét.

Tìm kiếm một số chứng chỉ cung cấp bởi Google hay IBM

Một số chứng chỉ hiện nay được cung cấp bởi Google hay IBM đều được xây dựng kèm với video hướng dẫn, bài tập, các bài kiểm tra và dự án cuối khóa. Cung cấp cho bạn kiến thức nền vững chắc để bắt đầu các vị trí Data Analyst. Tuy nhiên thời lượng các khóa khá dài và một hạn chế là bạn sẽ phải học bằng tiếng Anh.

Tham gia khóa học chuyên biệt từ các trung tâm

Nếu bạn muốn tập trung vào một kỹ năng tại một thời điểm hay là muốn học thêm một ngôn ngữ mới . Hãy tham gia khóa học Python hay R chuyên biệt. Tại GNV chúng tôi, luôn có những khóa học Python và R cho người mới bắt đầu và khóa học Nâng cao phù hợp với mọi yêu cầu và mọi đối tượng

Tham gia cả 2 ngôn ngữ lập trình

Một cách khác để xem bạn phù hợp với ngôn ngữ nào là tham gia cả hai lớp Python và R. Thử nghiệm học cả 2 khóa sẽ cung cấp những kiến thức nhất định, tất nhiên sẽ có những kiến thức bạn sẽ chưa cần tới. Tuy nhiên bạn sẽ dùng trong tương lai tại một thời điểm nào đó. Sau khi kết thúc khóa học nếu bạn cảm thấy ngôn ngữ nào phù hợp hơn thì sẽ tiếp tục học thêm về ngôn ngữ đó.

Nội dung