누군가 CSV 데이터를 구문 분석하기 위해 자바 스크립트 코드를 어디에서 찾을 수 있는지에 대한 아이디어가 있습니까?
답변
이 블로그 항목에서 언급 한 CSVToArray () 함수를 사용할 수 있습니다 .
<script type="text/javascript">
// ref: http://stackoverflow.com/a/1293163/2343
// This will parse a delimited string into an array of
// arrays. The default delimiter is the comma, but this
// can be overriden in the second argument.
function CSVToArray( strData, strDelimiter ){
// Check to see if the delimiter is defined. If not,
// then default to comma.
strDelimiter = (strDelimiter || ",");
// Create a regular expression to parse the CSV values.
var objPattern = new RegExp(
(
// Delimiters.
"(\\" + strDelimiter + "|\\r?\\n|\\r|^)" +
// Quoted fields.
"(?:\"([^\"]*(?:\"\"[^\"]*)*)\"|" +
// Standard fields.
"([^\"\\" + strDelimiter + "\\r\\n]*))"
),
"gi"
);
// Create an array to hold our data. Give the array
// a default empty first row.
var arrData = [[]];
// Create an array to hold our individual pattern
// matching groups.
var arrMatches = null;
// Keep looping over the regular expression matches
// until we can no longer find a match.
while (arrMatches = objPattern.exec( strData )){
// Get the delimiter that was found.
var strMatchedDelimiter = arrMatches[ 1 ];
// Check to see if the given delimiter has a length
// (is not the start of string) and if it matches
// field delimiter. If id does not, then we know
// that this delimiter is a row delimiter.
if (
strMatchedDelimiter.length &&
strMatchedDelimiter !== strDelimiter
){
// Since we have reached a new row of data,
// add an empty row to our data array.
arrData.push( [] );
}
var strMatchedValue;
// Now that we have our delimiter out of the way,
// let's check to see which kind of value we
// captured (quoted or unquoted).
if (arrMatches[ 2 ]){
// We found a quoted value. When we capture
// this value, unescape any double quotes.
strMatchedValue = arrMatches[ 2 ].replace(
new RegExp( "\"\"", "g" ),
"\""
);
} else {
// We found a non-quoted value.
strMatchedValue = arrMatches[ 3 ];
}
// Now that we have our value string, let's add
// it to the data array.
arrData[ arrData.length - 1 ].push( strMatchedValue );
}
// Return the parsed data.
return( arrData );
}
</script>
답변
CSV를 Javascript 데이터로 구문 분석하기위한 엔드 투 엔드 솔루션으로 작동하도록 설계된 jquery 플러그인입니다. RFC 4180에 제시된 모든 단일 에지 케이스를 처리합니다. 와 스펙이 누락 된 Excel / Google Spreadsheed 내보내기 (대부분 null 값 포함)에 나타나는 일부를 처리합니다.
예:
트랙, 아티스트, 앨범, 년
위험한, ‘버스트 라임’, ‘재해가 닥쳤을 때’, 1997
// calling this
music = $.csv.toArrays(csv)
// outputs...
[
["track","artist","album","year"],
["Dangerous","Busta Rhymes","When Disaster Strikes","1997"]
]
console.log(music[1][2]) // outputs: 'When Disaster Strikes'
최신 정보:
네, 아마도 완전히 구성 가능하다고 언급해야합니다.
music = $.csv.toArrays(csv, {
delimiter:"'", // sets a custom value delimiter character
separator:';', // sets a custom field separator character
});
업데이트 2 :
이제 Node.js의 jQuery 와도 작동합니다. 따라서 동일한 lib로 클라이언트 측 또는 서버 측 구문 분석을 수행 할 수 있습니다.
업데이트 3 :
Google 코드가 종료 된 이후 jquery-csv가 GitHub로 마이그레이션되었습니다 .
면책 조항 : 나는 또한 jQuery-CSV의 저자입니다.
답변
나는이 구현 스프레드 시트 프로젝트의 일환으로합니다.
이 코드는 아직 철저히 테스트되지는 않았지만 누구나 사용할 수 있습니다.
그러나 일부 답변에서 언급했듯이 실제로 DSV 또는 TSV 파일 이 있으면 값에서 레코드 및 필드 구분 기호를 사용할 수 없으므로 구현이 훨씬 간단해질 수 있습니다 . 반면에 CSV는 실제로 필드 내에 쉼표와 줄 바꿈이있을 수 있으므로 대부분의 정규식 및 분할 기반 접근 방식을 위반합니다.
var CSV = {
parse: function(csv, reviver) {
reviver = reviver || function(r, c, v) { return v; };
var chars = csv.split(''), c = 0, cc = chars.length, start, end, table = [], row;
while (c < cc) {
table.push(row = []);
while (c < cc && '\r' !== chars[c] && '\n' !== chars[c]) {
start = end = c;
if ('"' === chars[c]){
start = end = ++c;
while (c < cc) {
if ('"' === chars[c]) {
if ('"' !== chars[c+1]) { break; }
else { chars[++c] = ''; } // unescape ""
}
end = ++c;
}
if ('"' === chars[c]) { ++c; }
while (c < cc && '\r' !== chars[c] && '\n' !== chars[c] && ',' !== chars[c]) { ++c; }
} else {
while (c < cc && '\r' !== chars[c] && '\n' !== chars[c] && ',' !== chars[c]) { end = ++c; }
}
row.push(reviver(table.length-1, row.length, chars.slice(start, end).join('')));
if (',' === chars[c]) { ++c; }
}
if ('\r' === chars[c]) { ++c; }
if ('\n' === chars[c]) { ++c; }
}
return table;
},
stringify: function(table, replacer) {
replacer = replacer || function(r, c, v) { return v; };
var csv = '', c, cc, r, rr = table.length, cell;
for (r = 0; r < rr; ++r) {
if (r) { csv += '\r\n'; }
for (c = 0, cc = table[r].length; c < cc; ++c) {
if (c) { csv += ','; }
cell = replacer(r, c, table[r][c]);
if (/[,\r\n"]/.test(cell)) { cell = '"' + cell.replace(/"/g, '""') + '"'; }
csv += (cell || 0 === cell) ? cell : '';
}
}
return csv;
}
};
답변
다음은 쉼표, 줄 바꿈 및 이스케이프 된 큰 따옴표로 인용 된 필드를 처리하는 매우 간단한 CSV 파서입니다. 분할 또는 RegEx가 없습니다. 입력 문자열을 한 번에 1-2 자씩 스캔하고 배열을 만듭니다.
http://jsfiddle.net/vHKYH/ 에서 테스트하십시오 .
function parseCSV(str) {
var arr = [];
var quote = false; // true means we're inside a quoted field
// iterate over each character, keep track of current row and column (of the returned array)
for (var row = 0, col = 0, c = 0; c < str.length; c++) {
var cc = str[c], nc = str[c+1]; // current character, next character
arr[row] = arr[row] || []; // create a new row if necessary
arr[row][col] = arr[row][col] || ''; // create a new column (start with empty string) if necessary
// If the current character is a quotation mark, and we're inside a
// quoted field, and the next character is also a quotation mark,
// add a quotation mark to the current column and skip the next character
if (cc == '"' && quote && nc == '"') { arr[row][col] += cc; ++c; continue; }
// If it's just one quotation mark, begin/end quoted field
if (cc == '"') { quote = !quote; continue; }
// If it's a comma and we're not in a quoted field, move on to the next column
if (cc == ',' && !quote) { ++col; continue; }
// If it's a newline (CRLF) and we're not in a quoted field, skip the next character
// and move on to the next row and move to column 0 of that new row
if (cc == '\r' && nc == '\n' && !quote) { ++row; col = 0; ++c; continue; }
// If it's a newline (LF or CR) and we're not in a quoted field,
// move on to the next row and move to column 0 of that new row
if (cc == '\n' && !quote) { ++row; col = 0; continue; }
if (cc == '\r' && !quote) { ++row; col = 0; continue; }
// Otherwise, append the current character to the current column
arr[row][col] += cc;
}
return arr;
}
답변
다음은 RFC 4180에서 잘 작동하는 것처럼 보이는 PEG (.js) 문법입니다 (예 : http://en.wikipedia.org/wiki/Comma-separated_values 의 예제를 처리 함 ).
start
= [\n\r]* first:line rest:([\n\r]+ data:line { return data; })* [\n\r]* { rest.unshift(first); return rest; }
line
= first:field rest:("," text:field { return text; })*
& { return !!first || rest.length; } // ignore blank lines
{ rest.unshift(first); return rest; }
field
= '"' text:char* '"' { return text.join(''); }
/ text:[^\n\r,]* { return text.join(''); }
char
= '"' '"' { return '"'; }
/ [^"]
http://jsfiddle.net/knvzk/10 또는 http://pegjs.majda.cz/online 에서 사용해보십시오 . https://gist.github.com/3362830 에서 생성 된 구문 분석기를 다운로드 하십시오 .
답변
csvToArray v1.3
RFC4180 표준을 준수하는 CSV 문자열을 2D 배열로 변환하는 소형 (645 바이트) 호환 기능.
https://code.google.com/archive/p/csv-to-array/downloads
일반적인 사용법 : jQuery
$.ajax({
url: "test.csv",
dataType: 'text',
cache: false
}).done(function(csvAsString){
csvAsArray=csvAsString.csvToArray();
});
일반적인 사용법 : Javascript
csvAsArray = csvAsString.csvToArray();
필드 구분자 재정의
csvAsArray = csvAsString.csvToArray("|");
레코드 구분 기호 재정의
csvAsArray = csvAsString.csvToArray("", "#");
건너 뛰기 헤더 무시
csvAsArray = csvAsString.csvToArray("", "", 1);
모두 무시
csvAsArray = csvAsString.csvToArray("|", "#", 1);
답변
내가 왜 전 kirtans 수 없습니다 모르겠어요. 나를 위해 일하기 위해. 빈 필드 또는 후행 쉼표가있는 필드에서 실패한 것 같습니다 …
이것은 둘 다 처리하는 것 같습니다.
파서 코드를 작성하지 않고 파서 함수 주위를 래퍼로 작성하여 파일 작업을 수행했습니다. 기여 참조
var Strings = {
/**
* Wrapped csv line parser
* @param s string delimited csv string
* @param sep separator override
* @attribution : http://www.greywyvern.com/?post=258 (comments closed on blog :( )
*/
parseCSV : function(s,sep) {
// http://stackoverflow.com/questions/1155678/javascript-string-newline-character
var universalNewline = /\r\n|\r|\n/g;
var a = s.split(universalNewline);
for(var i in a){
for (var f = a[i].split(sep = sep || ","), x = f.length - 1, tl; x >= 0; x--) {
if (f[x].replace(/"\s+$/, '"').charAt(f[x].length - 1) == '"') {
if ((tl = f[x].replace(/^\s+"/, '"')).length > 1 && tl.charAt(0) == '"') {
f[x] = f[x].replace(/^\s*"|"\s*$/g, '').replace(/""/g, '"');
} else if (x) {
f.splice(x - 1, 2, [f[x - 1], f[x]].join(sep));
} else f = f.shift().split(sep).concat(f);
} else f[x].replace(/""/g, '"');
} a[i] = f;
}
return a;
}
}