5 Công Việc Cho Người Mới Bắt Đầu Nghề Phân Tích Dữ Liệu

5 Công Việc Cho Người Mới Bắt Đầu Nghề Phân Tích Dữ Liệu

5 Công việc nghề phân tích dữ liệu
5 công việc nghề phân tích dữ liệu

Tạo sẵn hồ sơ năng lực với năm bước cho người mới bắt đầu nghề phân tích dữ liệu.

Nếu bạn đã sẵn sàng bắt đầu sự nghiệp mới với tư cách là nhà phân tích dữ liệu, rất có thể bạn đã gặp phải tình huống khó xử muôn thuở. Danh sách công việc yêu cầu kinh nghiệm, nhưng làm thế nào để bạn có được kinh nghiệm nếu bạn đang tìm kiếm công việc nhà phân tích dữ liệu đầu tiên của mình?

Nội dung bài này nói về cách tạo hồ sơ năng lực. Các bước bạn đưa vào hồ sơ thể hiện kỹ năng và kinh nghiệm của bạn — ngay cả khi đó không phải từ công việc phân tích dữ liệu trước đây — cho người quản lý tuyển dụng và người phỏng vấn. Việc sắp xếp hồ sơ của bạn với các bước phù hợp có thể giúp bạn xây dựng niềm tin rằng bạn là người phù hợp với công việc, ngay cả khi chưa có kinh nghiệm làm việc trước đó.

Trong bài viết này, chúng tôi sẽ thảo luận về năm loại công việc bạn nên đưa vào hồ sơ phân tích dữ liệu của mình, đặc biệt nếu bạn mới vào nghề phân tích dữ liệu. Bạn sẽ thấy một số ví dụ về cách các dự án này được trình bày trong hồ sơ thực và tìm danh sách các tập dữ liệu công khai mà bạn có thể sử dụng để bắt đầu hoàn thành dự án.

Các ý tưởng cho Nghề phân tích dữ liệu

Là một nhà phân tích dữ liệu đầy đam mê, bạn sẽ muốn thể hiện một vài kỹ năng chính trong hồ sơ của mình. Các ý tưởng nàychỉ ra các công việc cơ bản đối với nhiều vai trò của nghề phân tích dữ liệu.

1. Web Scraping (thu thập dữ liệu trên web)

Có rất nhiều các bộ dữ liệu công khai tuyệt vời (và miễn phí) trên internet, nhưng bạn có thể muốn cho các nhà tuyển dụng tiềm năng thấy rằng bạn cũng có thể tìm và thu thập dữ liệu của riêng mình. Ngoài ra, biết cách thu thập dữ liệu web là một phần của nghề phân tích dữ liệu có nghĩa là bạn có thể tìm và sử dụng các tập dữ liệu phù hợp với sở thích của mình, bất kể chúng đã được biên soạn hay chưa.

HOT:  [Mách bạn] Học sâu là gì ? (Deep Learning - DL)

Nếu bạn biết một số Python, bạn có thể sử dụng các công cụ như Beautiful Soup hoặc Scrapy để thu thập dữ liệu trên web cho các dữ liệu thú vị. Nếu bạn không biết cách viết mã, đừng lo lắng. Bạn cũng sẽ tìm thấy một số công cụ tự động hóa quy trình (nhiều công cụ cung cấp bản dùng thử miễn phí), như Octoparse hoặc ParseHub.

Nếu bạn không chắc nên bắt đầu từ đâu, đây là một số trang web có các tùy chọn dữ liệu thú vị để truyền cảm hứng cho dự án của bạn:

  • Reddit
  • Wikipedia
  • Cổng thông tin việc làm

2. Làm sạch dữ liệu

Một phần quan trọng trong vai trò của bạn với tư cách là nghề phân tích dữ liệu là làm sạch dữ liệu để sẵn sàng phân tích. Làm sạch dữ liệu (còn được gọi là quét dữ liệu) là quá trình loại bỏ dữ liệu không chính xác và trùng lặp, quản lý bất kỳ lỗ hổng nào trên dữ liệu và đảm bảo định dạng của dữ liệu là nhất quán.

Khi bạn tìm kiếm một tập dữ liệu để thực hành dọn dẹp, hãy tìm một tập hợp bao gồm nhiều tệp được thu thập từ nhiều nguồn mà không cần phải kiểm duyệt nhiều. Một số trang web mà bạn có thể tìm thấy các tập dữ liệu “bẩn” để làm việc bao gồm:

  • CDC Wonder
  • gov
  • Ngân hàng thế giới
  • world
  • / r / bộ dữ liệu

3. Phân tích dữ liệu thăm dò (EDA)

Nghề hân tích dữ liệu là tất cả về việc trả lời các câu hỏi với dữ liệu. Phân tích dữ liệu khám phá, gọi tắt là EDA, giúp bạn khám phá những câu hỏi cần đặt ra. Điều này có thể được thực hiện riêng biệt hoặc kết hợp với làm sạch dữ liệu. Dù bằng cách nào, bạn sẽ muốn đạt được những điều sau đây trong quá trình điều tra ban đầu này.

  • Đặt nhiều câu hỏi về dữ liệu.
  • Khám phá cấu trúc cơ bản của dữ liệu.
  • Tìm kiếm các xu hướng, mẫu và sự bất thường trong dữ liệu.
  • Kiểm tra các giả thuyết và xác nhận các giả định về dữ liệu.
  • Suy nghĩ về những vấn đề bạn có thể giải quyết với dữ liệu.

10 bộ dữ liệu công khai miễn phí cho EDA

Một dự án EDA là thời điểm tuyệt vời để tận dụng sự phong phú của các bộ dữ liệu công khai có sẵn trực tuyến. Dưới đây là 10 bộ dữ liệu thú vị và miễn phí để giúp bạn bắt đầu khám phá.

  1. Trung tâm Quốc gia về Thông tin Môi trường: Tìm hiểu về nhà cung cấp dữ liệu thời tiết và khí hậu lớn nhất thế giới.
  2. Báo cáo Hạnh phúc Thế giới năm 2021: Điều gì khiến các quốc gia hạnh phúc nhất thế giới trở nên hạnh phúc?
  3. NASA: Nếu bạn quan tâm đến khoa học không gian và trái đất, hãy xem những gì bạn có thể tìm thấy trong số hàng chục nghìn bộ dữ liệu công khai do NASA cung cấp.
  4. Điều tra dân số Hoa Kỳ: Tìm hiểu thêm về con người và nền kinh tế Hoa Kỳ với dữ liệu điều tra dân số mới nhất từ ​​năm 2020.
  5. FBI Crime Data Explorer (CDE): Khám phá dữ liệu tội phạm được thu thập bởi hơn 18.000 cơ quan thực thi pháp luật.
  6. Bảng điều khiển COVID-19 của Tổ chức Y tế Thế giới: Theo dõi số lượng coronavirus mới nhất theo quốc gia hoặc khu vực của WHO.
  7. Dữ liệu Netflix mới nhất: Tập dữ liệu Kaggle này (cập nhật vào tháng 4 năm 2021) bao gồm dữ liệu phim được chia thành 26 thuộc tính.
  8. Google Books Ngram: Tải xuống dữ liệu thô từ Google Books Ngram để khám phá xu hướng cụm từ trong các cuốn sách được xuất bản từ năm 1960 đến năm 2015.
  9. Dữ liệu mở của NYC: Khám phá Thành phố New York thông qua nhiều bộ dữ liệu được công bố công khai về các chủ đề như dân số sóc ở Công viên Trung tâm đến các vụ va chạm xe cơ giới.
  10. Tập dữ liệu mở của Yelp: Xem những gì bạn có thể tìm thấy khi khám phá bộ sưu tập các bài đánh giá, đăng ký và thuộc tính kinh doanh của người dùng Yelp này.

4. Phân tích cảm xúc

Phân tích cảm xúc, thường được thực hiện trên dữ liệu văn bản, là một kỹ thuật trong xử lý ngôn ngữ tự nhiên (NLP) để xác định xem dữ liệu là trung tính, tích cực hay tiêu cực. Nó cũng có thể được sử dụng để phát hiện một cảm xúc cụ thể dựa trên danh sách các từ và cảm xúc tương ứng của chúng (được gọi là từ vựng).

HOT:  7 kỹ năng cần thiết: nhà phân tích nghiệp vụ chuyên nghiệp

Loại phân tích này hoạt động tốt với các trang web đánh giá công khai và các nền tảng truyền thông xã hội, nơi mọi người có khả năng đưa ra ý kiến công khai về các chủ đề khác nhau.

Để bắt đầu khám phá cảm nhận của mọi người về một chủ đề nhất định, bạn có thể bắt đầu với các trang web như:

  • Amazon (đánh giá sản phẩm)
  • Rotten Tomato (đánh giá phim)
  • Facebook
  • Twitter
  • Trang tin tức

5. Trực quan hóa dữ liệu

Con người là sinh vật trực quan. Nghề phân tích dữ liệu đòi hỏi trực quan hóa dữ liệu trở thành một công cụ mạnh mẽ để chuyển đổi dữ liệu thành một câu chuyện hấp dẫn để khuyến khích hành động. Những hình ảnh tưởng tượng tuyệt vời không chỉ thú vị khi tạo ra, chúng còn có sức mạnh để làm cho danh mục đầu tư của bạn trông đẹp mắt.

Năm công cụ trực quan hóa dữ liệu miễn phí

Bạn cũng không cần phải trả tiền cho phần mềm hình ảnh hóa nâng cao để bắt đầu tạo ra những hình ảnh xuất sắc. Đây chỉ là một số công cụ trực quan hóa miễn phí mà bạn có thể sử dụng để bắt đầu kể một câu chuyện bằng dữ liệu:

  1. Tableau Public: Tableau được xếp hạng trong số các công cụ trực quan hóa phổ biến nhất. Sử dụng phiên bản miễn phí để chuyển đổi bảng tính hoặc tệp thành hình ảnh trực quan tương tác (đây là một số ví dụ từ tháng 4 năm 2021).
  2. Google Charts: Thư viện các biểu đồ tương tác và các công cụ trực quan hóa dữ liệu này giúp bạn dễ dàng nhúng các hình ảnh trực quan vào danh mục đầu tư của mình bằng cách sử dụng mã HTML và JavaScript. Phần Hướng dẫn mạnh mẽ sẽ hướng dẫn bạn qua quá trình tạo.
  3. Datawrapper: Sao chép và dán dữ liệu của bạn từ bảng tính hoặc tải lên tệp CSV để tạo biểu đồ, bản đồ hoặc bảng — không cần mã hóa. Phiên bản miễn phí cho phép bạn tạo hình ảnh trực quan không giới hạn để xuất dưới dạng tệp PNG.
  4. D3 (Tài liệu theo hướng dữ liệu): Với một chút bí quyết kỹ thuật, bạn có thể làm được rất nhiều điều với thư viện JavaScript này.
  5. Biểu đồ RAW: Ứng dụng web mã nguồn mở này giúp bạn dễ dàng biến các bảng tính hoặc tệp CSV thành một loạt các loại biểu đồ mà nếu không có thể khó tạo. Ứng dụng thậm chí còn cung cấp các tập dữ liệu mẫu để bạn thử nghiệm.

Bonus: Kết thúc dự án

Không có gì sai khi tạo hồ sơ của bạn với các dự án nhỏ nêu bật các kỹ năng cá nhân đặc biệt khi mới vào nghề phân tích dữ liệu. Nhưng nếu bạn đã tìm kiếm dữ liệu của riêng mình trên web, bạn cũng có thể cân nhắc sử dụng chính dữ liệu đó để hoàn thành một dự án từ đầu đến cuối. Để làm điều này, hãy lấy dữ liệu bạn đã thu thập và áp dụng các bước chính của phân tích dữ liệu cho dữ liệu đó — làm sạch, phân tích và diễn giải.

HOT:  Khoa học dữ liệu (DS) khác với Phân tích dữ liệu (DA) ntn ?

Điều này có thể cho nhà tuyển dụng tiềm năng thấy rằng bạn không chỉ có các kỹ năng cần thiết của một nhà phân tích dữ liệu mà bạn còn biết chúng phù hợp với nhau như thế nào.

Có thể bạn cũng thích

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *