目录
通达信日K线.day、5分钟.rc5、1分钟.rc1历史数据格式
一、日K线数据格式
(一)通达信日线数据文件目录位置
日线数据存在这路径下 D:\通达信\vipdoc\sh\lday
下载安装通达信软件后,打开“系统”菜单,找到“盘后数据下载”选型,可下载日线.day、5分钟.rc5、1分钟.rc1历史数据。
如:日线数据下载后,存放位置在安装目录\vipdoc\sh\lday下(上证数据)和安装目录\vipdoc\sz\lday下(深证数据),每个股票对应一个文件。
比如我的通达信客户端安装在 c:\new_tdx 下
c:\new_tdx\vipdoc\sz\lday\ 下是深圳的日k线数据
c:\new_tdx\vipdoc\sh\lday\ 下是上海的日k线数据
该目录下每个股票为一个文件,如 sz000001.day 为深圳的日k行情.
D:\Thirdprogram\new_tdx_cfv\vipdoc\sh\lday
2021/09/23 16:00 36,096 sh603881.day
2021/09/23 16:00 31,456 sh603882.day
2021/09/23 16:00 44,448 sh603883.day
(二)通达信日线数据格式
通达信的日线数据格式如下:每32个字节为一天数据每4个字节为一个字段,每个字段内低字节在前。
00 ~ 03 字节 年月日,整型;
04 ~ 07 字节 开盘价*100,整型;
08 ~ 11 字节 最高价*100, 整型;
12 ~ 15 字节 最低价*100, 整型;
16 ~ 19 字节 收盘价*100, 整型;
20 ~ 23 字节 成交额(元),float型;
24 ~ 27 字节 成交量(股),整型;
28 ~ 31 字节 (保留)
c++
struct TdxRecord { // 日K线数据结构
unsigned int date; // e.g. 20100304
int _open; // *0.01 开盘价
int _high; // *0.01 最高价
int _low; // *0.01 最低价
int _close; // *0.01 收盘价
float amount; // 成交额
int vol; // 成交量(手)
int reserved;
float open(){ return 0.01*_open; }
float high(){ return 0.01*_high; }
float low(){ return _low*0.01; }
float close(){ return _close*0.01; }
};
(三)通达信日线数据格式的读取源代码
Python实现批量解析通达信day文件,导出至CSV
Python
data fiile path: D:\Thirdprogram\new_tdx_cfv\vipdoc\sh\lday\sh000001.day
import os
import struct
import datetime
def stock_csv(filepath, name):
data = [] with open(filepath, 'rb') as f:
file_object_path = 'D:/通达信/vipdoc/sh/pythondata/' + name +'.csv'
file_object = open(file_object_path, 'w+')
while True:
stock_date = f.read(4)
stock_open = f.read(4)
stock_high = f.read(4)
stock_low= f.read(4)
stock_close = f.read(4)
stock_amount = f.read(4)
stock_vol = f.read(4)
stock_reservation = f.read(4) # date,open,high,low,close,amount,vol,reservation
if not stock_date:
break
# 4字节如20091229
stock_date = struct.unpack("l", stock_date)
#开盘价*100
stock_open = struct.unpack("l", stock_open)
#最高价*100
stock_high = struct.unpack("l", stock_high)
#最低价*100
stock_low= struct.unpack("l", stock_low)
#收盘价*100
stock_close = struct.unpack("l", stock_close)
#成交额
stock_amount = struct.unpack("f", stock_amount)
#成交量
stock_vol = struct.unpack("l", stock_vol)
#保留值
stock_reservation = struct.unpack("l", stock_reservation)
#格式化日期
date_format = datetime.datetime.strptime(str(stock_date[0]),'%Y%M%d')
list= date_format.strftime('%Y-%M-%d')+ "," + str(stock_open[0]/100)+","
+str(stock_high[0]/100.0) +"," +str(stock_low[0]/100.0)+","
+ str(stock_close[0]/100.0)+"," + str(stock_vol[0])+"\r\n"
file_object.writelines(list)
file_object.close()
path = 'D:/通达信/vipdoc/sh/lday/'
listfile = os.listdir('D:/通达信/vipdoc/sh/lday/')
for i in listfile:
stock_csv(path+i, i[:-4])
输出为:
date open high low close amount volume
1991-12-23 27.70 27.90 27.60 27.80 3.530600e+06 127000
1991-12-24 27.90 29.30 27.00 29.05 3.050250e+06 105000
1991-12-25 29.15 30.00 29.10 29.30 6.648170e+06 226900
1991-12-26 29.30 29.30 28.00 28.00 5.370400e+06 191800
1991-12-27 28.00 28.50 28.00 28.45 5.988725e+06 210500
... ... ... ... ... ... ...
2017-06-22 9.15 9.40 9.14 9.25 1.325211e+09 142695815
2017-06-23 9.23 9.27 9.16 9.25 5.383036e+08 58400441
2017-06-26 9.26 9.40 9.26 9.30 6.637629e+08 71076995
(二) 通达信5分钟、1分钟数据格式
00 ~ 01 字节
日期,整型;计算方法为:year = floor(num/2048) + 2004; month = floor(mod(num,2048)/100); day = mod(mod(num,2048), 100);
02 ~ 03 字节
0点至目前的分钟数,整型
04 ~ 07 字节
开盘价*100,整型
08 ~ 11 字节
最高价*100,整型
12 ~ 15 字节
最低价*100,整型
16 ~ 19 字节
收盘价*100,整型
20 ~ 23 字节
成交额*100,float型
24 ~ 27 字节
成交量(股),整型
28 ~ 31 字节
(保留)
php
<?php
/**
* Created by PhpStorm.
* User: outao
* Date: 2020/8/12
* Time: 10:05
* 股票分析
*/
/**
* Class StockAction
* 大多数证券公司的行情软件都会使用通达信的引擎,因此数据存储格式是相同的:
* 数据目录:<安装路径>/vipdoc/[sz|sh|ot|ds|cw]/[lday|minline...]
* 其中:sz-深圳市场,sh-上海市场
* 日线在lday目录内
* 通达信日线*.day文件,文件名即股票代码
每32个字节为一天数据
每4个字节为一个字段,每个字段内低字节在前
00 ~ 03 字节:年月日, 整型
04 ~ 07 字节:开盘价*1000, 整型
08 ~ 11 字节:最高价*1000, 整型
12 ~ 15 字节:最低价*1000, 整型
16 ~ 19 字节:收盘价*1000, 整型
20 ~ 23 字节:成交额(元),float型
24 ~ 27 字节:成交量(手),整型
28 ~ 31 字节:上日收盘*1000, 整型
*
* 通达信5分钟线*.5文件
每32个字节为一个5分钟数据,每字段内低字节在前
00 ~ 01 字节:日期,整型,设其值为num,则日期计算方法为:
year=floor(num/2048)+2004;
month=floor(mod(num,2048)/100);
day=mod(mod(num,2048),100);
02 ~ 03 字节: 从0点开始至目前的分钟数,整型
04 ~ 07 字节:开盘价(分),整型
08 ~ 11 字节:最高价(分),整型
12 ~ 15 字节:最低价(分),整型
16 ~ 19 字节:收盘价(分),整型
20 ~ 23 字节:成交额(元),float型
24 ~ 27 字节:成交量(股)
28 ~ 31 字节:(保留)
*/
class StockAction extends Action{
const DATAFILEPATH="C:/zd_zsone/vipdoc";
const RECORDLEN=32; //记录长度,byte
public function fixedInv($func=""){
if(!empty($func) && method_exists(__CLASS__,$func)) $this->$func();
else{
$webVar=array();
$this->assign($webVar);
$this->display("fixedInv");
}
}
private function fixedInvCalc(){
$market=$_POST["market"];
$stockCode=$_POST["stockCode"];
$begindate=intval($_POST["begindate"]);
$enddate=intval($_POST["enddate"]);
$skipday=$_POST["skipday"];
$amt=$_POST["amt"]*10000;
$unit=$_POST["unit"]*10000;
$yield=$_POST["yield"]; //目标收益率%
$filePath=self::DATAFILEPATH.'/'.$market.'/lday/'.$market.$stockCode.'.day';
if(!is_file($filePath)){
echo "找不到数据文件:".$filePath;
return;
}
$this->write( "<pre>正在分析:$filePath<br>");
try{
$handle=fopen($filePath,"r");
//定位到开始日期
do{
$data=fread($handle,self::RECORDLEN);
if(false===$data) throw new Exception("找不到开始日期的数据");
$rec=$this->decode($data);
//$this->write('.');
}while($rec["date"]<$begindate);
//初始化资金
$pool=0; //积累的盈利
$funds=array(
"cash"=>$amt, //现金
"in"=>0, //已购买股票的资金
"stock"=>0, //股票数量
"value"=>0, //股票市值
"assets"=>$amt //总资产=cash+value
);
$md=0; //资金占用万元*日
do{
//按$rec数据进行投资分析
$note="";
//1、计算当前收益率
$nowYield=(0==$funds['in'])?0:($funds['value']-$funds['in'])/$funds['in']*100;
if($nowYield>=$yield){
//达到收益目标,卖出全部股票
/*
$pool += ($funds['value']-$funds['in']);
$note="达到收益目标, 累计收益".$pool;
$funds['cash'] += $funds['value'];
$funds['in']=$funds['stock']=$funds['value']=0;
$funds['assets']=$funds['cash'];
*/
//卖出一半股票
$sell=$funds['value']/2; //卖出一半股票获得的资金
$pool += ($funds['value']-$funds['in'])/2;
$note="达到收益目标, 累计收益".$pool;
$funds['cash'] += $sell;
$funds['in'] = $funds['value']/2; //相当于清仓后再买回一半的股票
$funds['stock']=$funds['stock']/2;
$funds['value']=$funds['value']/2;
$funds['assets']=$funds['cash']+$funds['value'];
}else{
//购买股票
if($funds['cash']<$unit) $note="资金不足";
else {
$buy = floor($unit / $rec['close'] / 100) * 100; //可购入股票数量,固定金额
//$buy = 6000; //固定股数
$value = $buy * $rec['close']; //使用资金
$funds['cash'] -= $value;
$funds['in'] += $value;
$funds['stock'] += $buy;
}
$funds['value'] =$funds['stock']*$rec['close']; //股票市值
$funds['assets'] =$funds['cash']+$funds['value'];
}
/*
if($funds["cash"]==0) $nowYield=0;
else $nowYield=($funds['value']/$funds['cash']-1)*100;
//echo $nowYield;
if($nowYield>=$yield){
//达到收益目标,卖出全部股票
$pool += ($funds['assets']);
$note="达到收益目标".$pool;
$funds['cash']=$funds['assets']=0;
$funds["stock"]=$funds["value"]=0;
}else{
//购买股票
if(false) $note="资金不足";
else{
$buy=floor($unit/$rec['close']/100)*100; //可购入股票数量
$value=$buy*$rec['close']; //使用资金
$funds['cash'] +=$value;
$funds['stock'] +=$buy;
$funds['value'] =$funds['stock']*$rec['close']; //股票市值
$funds['assets'] =$funds['value'];
}
}
*/
$md += $funds['in']/10000*$skipday;
//echo $md;
printf("日期:%d\t收盘价:%.3f\t现金:%10.2f\t投入:%10.2f\t市值:%10.2f\t总资产:%10.2f\t%s\n",
$rec['date'],$rec['close'],$funds['cash'],$funds['in'],$funds['value'],$funds['assets'],$note);
$rt=fseek($handle,$skipday*self::RECORDLEN,SEEK_CUR );
//var_dump($rt);
if(-1==$rt) throw new Exception("没有更多的分析数据了"); //跳过一个投资周期的天数
$data=fread($handle,self::RECORDLEN);
//var_dump($data);
if(empty($data)) throw new Exception("没有更多的分析数据了");
$rec=$this->decode($data);
}while($rec["date"]<=$enddate);
fclose($handle);
}catch (Exception $e){
echo $e->getMessage()." 处理终止<br>";
//return;
}
$total=$funds['assets'];
$p=$total-$amt; //总收益
printf("最后总资产:%.2f\t总收益:%.2f\t万元日收益:%.2f\t年化收益率:%.2f%%\t 收益率:%.2f%%\n",
$total,$p,$p/$md,$p/$md*250/100, ($total/$amt-1)*100);
echo "处理结束<br></pre>";
}
private function write($str){
echo $str;
ob_flush();
flush();
}
//解码一条记录
private function decode($data){
$rec=array();
$rec["date"]=$this->bin2int($data,0); //日期
$rec["open"]=$this->bin2int($data,4)/1000; //开盘价
$rec["height"]=$this->bin2int($data,8)/1000; //最高价
$rec["low"]=$this->bin2int($data,12)/1000; //最低价
$rec["close"]=$this->bin2int($data,16)/1000; //收盘价
$rec["turnover"]=$this->bin2int($data,20); //成交额
$rec["valume"]=$this->bin2int($data,24); //成交量
$rec["preclose"]=$this->bin2int($data,28)/1000; //上日收盘,没数据
return $rec;
}
private function bin2int($data,$start){
$end=$start+3;
$val=0;
for($i=$end; $i>$start; $i--){
$val += ord($data[$i]);
$val = $val<<8;
}
$val += ord($data[$i]);
return $val;
}
}
https://www.ilovematlab.cn/thread-226577-1-1.html(ok)
日记文件数据格式
struct TdxDiary_Idx {
int id; // 0xffffffff = deleted, auto incr
char dummy1; // = 0x00
char symbol[7]; // 7 char = 6 char symbol + 1 char '\0'
int date; // 20110407
int time; // 13:14:25 = 131425
int weather; // 00 = 晴, 01=阴, 02=雨, 03=雪
char title[64]; // title
int offset; // offset in "symbol.cnt"
int length; // content length
int date2; // date2 = date
int time2; // time2 = time
void set(const char *symbol, const char *title, int offset, int length){
memset(this->symbol, '\0', 7);
memset(this->title, '\0', 64);
this->dummy1 = '\0';
this->weather=0x03;
strcpy(this->symbol, symbol);
strcpy(this->title, title);
this->offset = offset;
this->length = length;
}
void datetime(int date, int time){
this->date = date; this->time = time;
this->date2 = date; this->time2 = time;
}
};
c#
读写通达信日记文件 E:\thirdprogram\国泰君安锐智版\T0002\diary\sh\600732.idx 该文件只保留了文件标题信息 文件内容在600732.cnt中
/// <summary>
///功能:读写通达信日记文件 E:\thirdprogram\国泰君安锐智版\T0002\diary\sh\600732.idx 该文件只保留了文件标题信息 文件内容在600732.cnt中
/// </summary>
public class TdxDiaryFileRecordStruct
{
//E:\thirdprogram\国泰君安锐智版\T0002\diary\sh\600732.idx
//该文件只保留了文件标题信息
//文件内容在600732.cnt中
[StructLayout(LayoutKind.Sequential, Pack = 1)]
public struct DiaryFileRecordStruct //RecordSize= 104,其他数字为第几次日记,包括修改
{
[MarshalAs(UnmanagedType.I4)] //4byte FF FF FF FF 或08 00 00 00 如果是0XFF FF FF FF则表示记录作废 其他为第几次
public Int32 ValidLable;
[MarshalAs(UnmanagedType.I1)] //1byte 01
public byte Unknow1;
[MarshalAs(UnmanagedType.ByValTStr, SizeConst = 7)] //6byte 36 30 30 30 30 30
public string StockCode;
[MarshalAs(UnmanagedType.I4)] //,K线日期日期 B7 DE 32 01
public Int32 KLineLableDate;
[MarshalAs(UnmanagedType.I4)] //,K线时间 49 36 03 00
public Int32 KlineLableTime;
[MarshalAs(UnmanagedType.I4)] //,4 byte 未知 00 00 00 00
public Int32 Unknow3;
[MarshalAs(UnmanagedType.ByValTStr, SizeConst = 64)] //64 byte 文本内容
public string DiaryTitle;
[MarshalAs(UnmanagedType.I4)] //文本内容在600732.cnt 中的偏移字节数 91 01 00 00
public Int32 CntFileOffsetPostion;
[MarshalAs(UnmanagedType.I4)] // 文本内容在600732.cnt 中的字节数长度09 00 00 00
public Int32 CntFileLength;
[MarshalAs(UnmanagedType.I4)] //,最后修改日期20111031 B4 DE 32 01
public Int32 UpdateDate;
[MarshalAs(UnmanagedType.I4)] //,最后修改时间200604=20:06:04 49 36 03 00
public Int32 UpdateTime;
}
}
通达信股票代码和名称数据格式
从通达信系统获取股票代码信息
1.通达信股票代码数据格式文件位置
通达信系统股票代码信息保存在安装目录下T0002\hq_cache子目录,文件名分别为shm.tnf、szm.tnf
2.通达信股票代码数据格式结构
struct TdxSymbolMap {
char symbol[6]; // 6 digits
char dummy1[18]
char name[8]; // 4 characters in GB2312
char dummy2[218];
}
read
void tdx_read_symbols(const char *file){
FILE *fp=fopen(file.c_str(),"rb");
fseek(fp, 50, SEEK_SET);
char buf[250];
while(250 == fread(buf,1,250,fp)){
std::string symbol(buf,0,6);
std::string name(buf+24,8);
}
fclose(fp);
}
输出结果:pandas DateFrame
列名含义:
sc:市场代码,sh沪市,sz深市
gpdm:股票代码(9位),如002294.SZ,索引
gpmc:股票名称,如信立泰
gppy:股票拼音,如XLT
gplb:股票类别,如深市中小板A股
通达信V6.1股票代码文件格式分析:https://blog.csdn.net/starsky2006/article/details/5863438
概念板块数据结构
概念板块数据结构
文件存储路径:tdx\T0002\hq_cache\block.dat
文件存储格式:
文件头:384字节
板块个数:2字节
各板块数据存储结构(紧跟板块数目依次存放)
每个板块占据的存储空间为2812个字节,可最多包含399个个股
板块名称:9字节
该板块包含的个股个数:2字节
板块类别:2字节
该板块下个股代码列表(连续存放,直到代码为空)
个股代码:7字节
tdx\T0002\hq_cache\block.dat:
typedef struct _TDXBLOCKDATAFILEHEADER
{
union
{
char Header[0x182];
};
}TDXBLOCKDATAFILEHEADER,*PTDXBLOCKDATAFILEHEADER;
typedef struct _TDXBLOCKDATA
{
char BlockName[9];
unsigned short int Num;
unsigned short int Data1;
char CodeName[400][7];
} TDXBLOCKDATA,*PTDXBLOCKDATA;
typedef struct _TDXBLOCKDATFILE
{
TDXBLOCKDATAFILEHEADER Header;
TDXBLOCKDATA Block[n];
}TDXBLOCKDATFILE,*PTDXBLOCKDATFILE;
自定义板块存储数据结
自定义板块存储数据结
板块名称文件:\tdx\T0002\block.cfg
存储结构:
空白:4字节
板块名称:10字节字符串
板块简码:5字节字符串
自定义的各板块个股存储
文件名:tdx\T0002\blocknew\ + 自定义板块简码(与block.cfg文件中的各板块简码同)
数据存储结构:
个股分隔符:2字节
个股属性代码:1字节(1:表示上证;0:表示深证)
个股名称:6字节
自选股票T0002\blocknew\ZXG.blk
通达信权息文件(gbbq)
http://blog.csdn.net/fangle6688/article/details/50956609
http://blog.sina.com.cn/s/blog_6b2f87db0102uxo3.html
C:\new_hxzq_hc\T0002\hq_cache\gbbq
#encoding=utf-8
import struct
from ctypes import *
import pandas as pd
import sys
### take ref this article :http://blog.csdn.net/fangle6688/article/details/50956609
### and this http://blog.sina.com.cn/s/blog_6b2f87db0102uxo3.html
class GbbqReader(object):
def get_df(self, fname):
if sys.version_info.major == 2:
bin_keys = bytearray.fromhex(self.hexdump_keys)
else:
bin_keys = bytes.fromhex(self.hexdump_keys)
result = []
with open(fname, "rb") as f:
content = f.read()
pos = 0
(count, ) = struct.unpack("<I", content[pos: pos+4])
pos += 4
encrypt_data = content
# data_len = len(encrypt_data)
data_offset = pos
for _ in range(count):
clear_data = bytearray()
for i in range(3):
(eax, ) = struct.unpack("<I", bin_keys[0x44: 0x44 + 4])
(ebx, ) = struct.unpack("<I", encrypt_data[data_offset: data_offset+4])
num = c_uint32(eax ^ ebx).value
(numold, ) = struct.unpack("<I", encrypt_data[data_offset + 0x4: data_offset + 0x4 + 4])
for j in reversed(range(4, 0x40+4, 4)):
ebx = (num & 0xff0000) >> 16
(eax, ) = struct.unpack("<I", bin_keys[ebx * 4 + 0x448: ebx * 4 + 0x448 + 4])
ebx = num >> 24
(eax_add, ) = struct.unpack("<I", bin_keys[ebx * 4 + 0x48: ebx * 4 + 0x48 + 4])
eax += eax_add
eax = c_uint32(eax).value
ebx = (num & 0xff00) >> 8
(eax_xor, ) = struct.unpack("<I", bin_keys[ebx * 4 + 0x848: ebx * 4 + 0x848 + 4])
eax ^= eax_xor
eax = c_uint32(eax).value
ebx = num & 0xff
(eax_add, ) = struct.unpack("<I", bin_keys[ebx * 4 + 0xC48: ebx * 4 + 0xC48 + 4])
eax += eax_add
eax = c_uint32(eax).value
(eax_xor, ) = struct.unpack("<I", bin_keys[j: j + 4])
eax ^= eax_xor
eax = c_uint32(eax).value
ebx = num
num = numold ^ eax
num = c_uint32(num).value
numold = ebx
(numold_op, ) = struct.unpack("<I", bin_keys[0: 4])
numold ^= numold_op
numold = c_uint32(numold).value
clear_data.extend(struct.pack("<II", numold, num))
data_offset += 8
clear_data.extend(encrypt_data[data_offset: data_offset+5])
(v1,v2, v3,v4,v5,v6,v7,v8) = (struct.unpack("<B7sIBffff", clear_data))
line = (v1,
v2.rstrip(b"\x00").decode("utf-8"),
v3,
v4,
v5,
v6,
v7,
v8)
result.append(line)
data_offset += 5
df = pd.DataFrame(data=result, columns=['market', 'code', 'datetime', 'category',
'hongli_panqianliutong',
'peigujia_qianzongguben',
'songgu_qianzongguben',
'peigu_houzongguben'])
return df
hexdump_keys
if __name__ == '__main__':
result = GbbqReader().get_df(r"C:\new_hxzq_hc\T0002\hq_cache\gbbq")
print(result)