Blog Posts DevOps

Atlassian phân tích gì về DevOps

Atlassian đã bổ sung tính năng postmortem cho JiraOps, tập hợp danh sách tất cả các sự kiện chính từ bất kỳ sự cố CNTT nào theo thứ tự thời gian để dễ dàng phân tích những gì đã xảy ra, xác định nguyên nhân gốc và nêu vấn đề trực tiếp trong nền tảng JiraOps để đảm bảo các hành động tiếp theo sẽ phù hợp.

Đồng thời, Atlassian đang mở rộng thêm tính năng Automation Actions, một thiết lập tự động thông qua scripts và playbooks có sẵn trong Opsgenie để hỗ trợ cho Trình quản lý hệ thống dịch vụ web của Amazon (Web Services (AWS) Systems Manager) và Generic REST Endpoint. Những tính năng đó mở rộng khả năng cho các nhóm DevOps khởi chạy các tác vụ tự động từ trong bảng điều khiển Opsgenie hoặc các ứng dụng di động. Opsgenie là một ứng dụng thông báo mà Atlassian có được thông qua việc sát nhập và được công bố cùng ngày ra mắt JiraOps.

Atlassian cũng đang chia sẻ dữ liệu quản lý sự cố mà hãng đã thu thập trong suốt cả năm. Nhìn chung, khách hàng của hãng có thể ghi nhận hơn 190.000 sự cố và các sự kiện bảo trì theo lịch trình. Các cập nhật cho những sự kiện này đã được thực hiện hơn 564.000 lần, điều này đã thúc đẩy việc cung cấp hơn 130 triệu email và tin nhắn văn bản cho người dùng cuối.

Thật không may, báo cáo của Atlassian cũng chỉ tìm thấy 3% của các báo cáo sự cố bao gồm bất kỳ loại phân tích hậu biến nào. Một vấn đề mà công ty đang cố gắng giải quyết thông qua bản cập nhật mới nhất cho JiraOps.

Ông Daniel Olinsky, trưởng bộ phận tiếp thị sản phẩm quản lý sự cố tại Atlassian, cho biết khi các tổ chức chuyển từ chủ yếu triển khai ứng dụng tại chỗ sang đám mây, nhiều người trong số họ đang bắt đầu nắm bắt đầy đủ hơn các thực tiễn của DevOps. Một trong những nguyên lý trung tâm của DevOps là tự động hóa  càng nhiều quy trình càng tốt, bao gồm cả quản lý sự cố. Bằng cách tích hợp quản lý sự cố và các quy trình DevOps, lượng thời gian downtime mà bất kỳ ứng dụng nào gặp phải trong suốt vòng đời của nó có thể giảm đáng kể, ông nói.

Thách thức lớn nhất mà nhiều tổ chức CNTT hiện nay phải đối mặt là trộn lẫn các hoạt động của DevOps và quy trình quản lý sự cố, thường phát triển tách biệt với nhau. Tuy nhiên, các quy trình đó đang được thống nhất khi nhiều tổ chức thực hiện chuyển đổi kỹ thuật số các quy trình kinh doanh luôn cần có sẵn. Bất kỳ sự cố nào có thể dẫn đến thời downtime của ứng dụng hiện nay đều có ý nghĩa doanh thu tiềm năng vượt xa ảnh hưởng xấu đến năng suất của nhân viên. Trên thực tế, các thông tin liên lạc rõ ràng, chính xác liên quan đến bất kỳ sự cố CNTT nào hiện đang là một kỳ vọng trong kỷ nguyên DevOps, Olinsky nói.

Các tổ chức sẽ thực hiện tự động hóa quản lý sự cố ở các mức độ khác nhau. Nhưng tại thời điểm mà thời gian giải quyết trung bình đang được đo lường mạnh mẽ hơn bao giờ hết, nhiều chuyên gia CNTT sẽ nhân được hoa hồng để tự động hóa càng nhiều quy trình càng tốt. Luật của Murphy cũng ra lệnh rằng các sự cố sẽ tự biểu hiện vào thời điểm bất tiện nhất, do đó, việc có thể tự động hóa một quy trình từ thiết bị di động có thể giúp loại bỏ việc đi đến văn phòng trong đêm khuya để giải quyết sự cố.

Có thể mất một thời gian trước khi các tổ chức CNTT có thể tự động hóa hoàn toàn mọi phản ứng đối với sự cố CNTT. Nhưng khi quá trình có thể được tự động hóa được xác định, xác suất một sự kiện thảm khốc thực sự có khả năng làm tê liệt toàn bộ tổ chức càng thấp.

VI